高等学校教材 


^ I wx 

j 

第 2 版 

北京大学 
陈家鼎孙山泽 

孪东 ra , 刘力平 

I 


言笔劫眘屮枥京 + 

n 飞翟 r-j # vo ■-*- 



内容提要 


本版对初版的许多章节进行了改写与扩充，增添了许多重要的内容和实 
际应用例子，在叙述方法和内容编排上注意重点与非重点、基本内容与进一 
步内容的界限，层次分明，便于教学。全书共8章，包括绪论、估计、假设检 


验、回归分析与线 性模遒 、试 验供计 与方差分析/序贯分析初歩、统计决策与 
贝叶斯统计大意、抽查概 i 等，内智 i 丰 i 、 重点美出、免字确切易懂。 


本书可作为高等学校数学专业、统计学专业及有关专业数理统计课程的教材 
或参考书。 
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吸取了国内外近 io 年来出版的多部数理统计优旁教材（见参考书 
目）的一 些好的 讲法，本版对初版的许多章节进行了改写与扩充， 
以便在内容上和编排上更好地适应高等学校相关专业“数理统计” 
课程的教学需要及数理统计的应用需要。 

本版的特点可概述如下。 
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( l ) 对寻找置信区间和置信限的方法进行了系统论述； 
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方法； 

(4) 介绍了比率的检验方法，特别是 Fisher 精确检验法； 

(5) 对逻辑斯谛回归作了初步 介绍； 

(6) 对考虑交互作用的正交设计作了初步介绍；等等。 

(二） 增加了许多实际应用例子。主要是增加了日常生活、社 
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本检验时，介绍了某公安局两个刑侦组破案能力的 比较； 在讲多元 
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(三） 在叙述方法和内容编排上注意重点与非重点、基本内容 
与进一步内容的界限，做到层次分明，便于教学。前四章是本书的 
主体部分。某些内容（包括新添加的一些内容）小字排印或标题上 
打上 * 号，以示这些内容不是最基本的，不要求学生掌握。“回归 
分析”的讲法有较大改变，先对一元线性回归作系统论述，然后再 



讲线性模型和多元回归。考虑到有些读者不熟悉线性空间的投影 
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理论，本版以附汪的形式详细介绍了不用“投影理论”的处理方法 
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学大纲规定的多一些，更比课堂实际讲授的多一些。这样做有利 


于学生课外，阅读，使有余力的学生选学更多的东西。 

编者力阁与 0 +伹汫.写屮反映时件精袖的奋發#射。佰限千 
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水平， 书中的 缺点、谬误一定不少，欢迎读者和专家批评指出。 


陈家鼎孙山泽李东风刘力平 

2003年12月于北京大学数学学院 
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由于数理统计学在很多科学研究、工程技术和经济管理的领 
域里有广‘泛应用，许多高等院校都开设数理统计课。本书是根据 
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名讲义（北京大学油印本）的基础上进行较大的改写与扩充而成 
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的。在编 与过桎〒，我 j ] 汪蒽 > r 卜列谷 点： 

1) 力图对数理统计学的基础部分进行比较准确而全面的系 
统论述，注意介绍统计思想和统计方法，特别重视数理统计学与社 
会实践的联系。 

2) 本书是入门读物，只要隶读者学过微积分、线性代数和初 
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等概率论。为了叙述数理统计学的现代发展，有少量内容涉及实 
变函数论，个别地方涉及测度论。这些涉及较深数学的内容不是 


本书的基本部分，不要求读者掌握。 

3) 我们认为，大学教材的内容应比教学大纲规定的多一些， 
更应比课堂实际讲授的多一些。这样做有利于学生课外阅读，使 
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敎字时数远字邵分内答，只要求字生有初步了解。我们把前四草 
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掌握。 


本书初稿完成后，承蒙中山大学邓永录教授、邓集贤教授、杨 
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进行了细心的审阅，他们提出了很多宝贵的意见。我们在修改和 
定稿时充分考虑了这些意见，在此向他们表示衷心感谢。高等教 
育出版社高尚华同志对本书的编写、审查与出版始终给予很大帮 



助，在此一并致谢。 
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由于我们水平有限，本书一足有不少蛱点和错误，欢迎谷地专 
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§1 数理统计学的研究对象 


数理统计学是数学的一个重要分支.它研究怎样有效地收 
集、整理和分析带有随机性的数据，以对所考察 的问题 作出推断或 
预测，直至为采取一定的决策和行动提供依据和建议.若在这句 
文字中去掉“带有随机性的”这几个字，那就是统计学的研究范围. 
统计学也就是数据科学.由于实践中人们收集到的数据大都受到 
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多西方国家（如美国），这两个名词的含义某本相同，许 多太 学里统 


计系就是研究数理统计学的，使用“数理统计学”一词时只是强调 

统 i + 盎由田剌泪龛视件齡受亦葙围由千所中的原田 . 汶而个夂 
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词在实际使用时有较大差别.笔者相信 ，在 若干年后•，这两个名词 
所指的范围将相差不大/ 


数理统计学在工农业生产、工程技术、.自然科学、经济学、社会 

砂维細沾独古阳 6 h r^r FH +县命 Gmaff ® 工来 Tr Xffl 始斗砂 66 ED ： 
t 寸识撕乍卩，曰口 y 瓜用，/、里： ^ cm 、| Hj；tzww j h/i 

究范围.举几个 例子： 
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问题.寿命试验是破坏性试验，只能抽取少量产品做试验.为了 
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评价某批电子设备的使用寿命，随机抽取了 18台做试验,测得寿 

合救捉加 T ( 里仿 . h '). 17. ?9. R 0. fi 8.100.1.^0.140.^70.280. : U 0. 
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410，450,520,620,190,210,800,1100/ 

问:整 批电子设备中，寿命超过200 h 的占多大比例? 

(从第二章知，这个比例大约是 e ~^= 0 . 533.) 









有些寿命问题更为复杂，如导弹的贮存寿命如何确定？设某 
部门生产同一型号的一批导弹，制造后进行贮存，以备将来之用. 


导弹吧 存太久功能就失效，变成废品 • 怎样合理地确定忙存期? 
这是很重要的实际问题.若随机抽取《件进行使用试验.设第/ 
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效或无效.在前者情况下，第；个导弹的 It 存寿命大于^，在后者 
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情况下第 〖个导 弹的贮存寿命小于在两种情况下，精确的贮存 

卷合县不铀 谐的 右了 H 沬悉刑的称拒.加何输宙孩刑县 忌睡的 
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c 存期？ 

(2) .某针织厂进行技术革新.在针织品的漂白工艺过程中， 
要考虑温度对针织品断裂强力（主要质量指标）的影响.为了比较 
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验，测得数据 如下： 
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80 t ： 时的强 力： 17. 7, 20. 3, 20.0，18.8, 19. 0, 20. 1, 
?.n 9 .iq i 

v y ^ w 丄 • 


究竟两种温度下的强力有没有差别？可以算出这个 试验中 
70 ° C 下的平均强力是 20. 4,80 °0下的平均强力是 19. 4,这1个单 

位的差别主要是由于温度不同造成的还是由于随机误差造成的 

/ C14 -在去 l=t 0/0 tte 一 IT i4A 抓 40、、/ rV 二^山 丄 \ r> ll/r 口 ll 斗曰 IJL o 

起、，讧 1 吒一恤戊 r tJViOLVsm^juL^^r^ : 金力 u 広疋 'i i a r 

从第三章知道，这 i 个单位的差别主要是由于温度不同造成 

上行八 O/^N r-fc L 上 L "IQ F - -r*A^ j V * t - 1^. 

的 ， /u i 町的独刀俩头 7 ： 些 . 

(^) 苴公害茴右而个荆估钳 . 弇讨去一钜由笛一细培丰 25 件 

、_， % f ^ | ^ ■-嗦 | / I s 蜃 〆、 •TXJL 7 |-^ I f 4 "#-p^ ^ - I I 


人命案，结果侦破了 23 件; 第二组接手了 35 件人命案，结果侦破 
T 30件， 问：两 个组的侦破能力有无差别？ 

从第三章知道，没有理由认为两个组的侦破能力有差别. 

(4) 在使用海洋重力仪探测海底石油时，仪器上显示出的信 


号 1(0 乃是重力加速度信号 5(0 与海浪干扰信号》(〖)的叠加: 



⑴ = s(t) + n{t) 


(0<«< T) 


—»-* I 丨觚 # v i »—■ / 、 丨* —• 1-^t - * - r —• 身 ▲ t ■會 ^ \ ^ ■—t ^ 、 • • • ■ — * % ■ . 〆 

十杌信亏 nU ) 的强皮一舣是有用信兮 sU ) 的卞力借. W : 卯 

>teru 3 S 不撕裡县由烟撕辟倍县想肋 m 求？ + fa 故且加 > ter 沿彳 +— 

r y I l/U l~5 I JLJ 11-1 v u Y I / 4AC UL|，|、i \dzs /jyU I r I 

个滤波器使得输入是时输出是 s ( t )( 0 « T )? 

:!士人 1 口瓶 口工 QA 4 H * 4 a 7 n ~ 

X^r I I W J « 2 SL -1 J ，以卞纖 、 m 一 b 不 不地伙 I 入负 

的同志合作解决了. ^ 

( 5 ) 在低钴定膨胀合金材料研究中，如何确定 Ni 、 Co 、 Cu、Fe 

的合话比例以保证合全材料的膨胳系教与陶姿材料的膨胳系数狍 

» - ▼ ■ ■ ^ r 9 ~ ▼ | T ^ P P 丨 》▼ W ^ ^ ^ ^ | T ^ ■ _ 酽謇 ▼ fW-^ r ^ ^ I ^ ^ 

接近？如何做到尽量节省 Co 的用量？ 

这个问题可用数理统计中的回归分析法处理，已于’ 20 世纪 

/ 

_ 泰 A b _. I _ h— W k «. w Ai 1 ▲ 鳥 V i i ▲ I i v ♦ M V A to A * * 塵 __ ■ ^ ^ 鲁 i 麄 處 

70 年代被北京大学和冶金部等早位的问志合作解決 厂， 参看弟 
四章. 

( 6 ) 为了探讨吸烟与患慢性支气管炎是否有关联，调査了 339 

1 达 、/ D -hn -IT 士 

7 K. i^yL^H r ^pc : 


人数 

患慢性支气管炎 

未患慢性支气管炎 

合计 

眼 拥 

ry^=% 

4 穴 
*> 

Ifi ? 

^ w 

9 . 0 ^ 

小吸烟 

13 

1 Z 丄 

遍 

丄34 

合计 

56 

283 

339 


• • 、 W • . . , 着 t t - 矣 、身 ___ 

W :从这 扣:数据酡古断足思慢饪叉气営炎与吸烟有天？ 

利用列联表分析法知答案是肯定的.参看第三章. 

从上面几个例子看出，数理统计能够处理的问题是多种多样 
的.哪儿有受随机性影响的数据，哪儿就有数理统计的问题.为 
了研究随机现象(偶然现象）中的规律性，就需要收集数据，并在此 
基础上对数据进行分析（由表及里、由此及彼），以得出科学的结 

论，汶市县数理统计学的仟备.当然，和整个数学一样，数理统计 

▼ - w - ■ ， v 冒琴 * ■ 冒 ^ v ， ， ， ■ ^ 严， ■ 

学只是各个学科各个业务领域的研究工具，解决实际问题时不能 
离开所论问题的专门知识. 


龟 . i 


数理统计学含有手冨的、统计方法与糸统的数学理论.它与整 















个数学大厦的其他部分有密切关系.数理统计学中用到很多近代 

^ ^ k ^ 里 ^ ^ a & ^ k _ 里 在 ^ ^ h h ▲ b t »- -». 祖 ‘ fe h - 

数学知识，主要是微积分、函数论、线性代数，也用到泛函分析、拓 

士 L 每扣 A 米 ( r 妙： bh 在/ n 嫌瓜 n / FTT 664 cn 4 口 /口 tr * fr ： Effl 姑斗 砂丑 

x：ai 口 I、： y u rj oy jw p、 ， utL xa >ai </l» m w 

系最密切的是概率论.在很大程度上可以说:概率论是数理统计 

A/t 甘 nli ^ rta J 丄批曰 4ttr 杰）人 AA : £4* 士 m /q A 、 i 曰 tttt 人并 TTil 

子 ITJ 空 flffl ，似牲巩|/|子疋佩平一作歷川. ItL 匕 IU 疋門’厂开7，」 


的数学分支学科，没有从属关系 


数理统计学又是一门实践性很强的应用科学，它同大量的数 

抿打 夺道 _ 々卜捆撕捉县一件 + 分莆萆而 V 和坐慜拙的丁作 .由孑 

■# 鏵 — 〜 r - y^*m- ，一 ■»* >^V"^ -*/b-i It I ^-4 ~ 一 • , W / 、 — ■ h . • ^ 、，/、 "V — ■—* I I , -# 

计算机是数理统计学的重要工具 > 每位优秀的数理统计工作者应 


该不仅具有良好的数学棊础，而且能够熟练地使用电子计 算机. 


St O jKfrXR 始 4 >U 幽秘 甘士撇 ▲ 

» 厶 yfx^^/L v \ 十 口;；巫个 m > is 、 

私 TW 分 2 丄地 廿 一 ir - 4 WT 人 B M / 4 * 4 ^A - Jr - 分 2 丄_^ 丄 Im JJX 

似牲巩 H 子 mi 取空+佩;3、定：起、件、汗+、巩 H 里、10 H vIESt 0 L 

检验、统计决策等. 

• ， ■ - - ^ 严 ■— 7 • 

我们常把被研究的对象的全体(包括有形的和潜在的)称作总 

汰 _ 蚩用随机亦暑（随机向暑_瞄机彳计 坦） Y I 卖元一个啟汰 （ 或啟 

I I • • I -# / »■* I W M V I ^ CA - 1 ^ W I 、 | ^ u - w U |~ JL * x — — ， I ， ，- 9 ， I *»«^，r I ' •- ，«^* 

I 

体的特性值），例如用 X 表示一批电子设备的寿命，意思是 :从中 
任意抽取一件电子设备，其寿命是不能预先确定的，可看成随机变 
量 X 的值.本讲义是数理统计学的入门教材，主要讨论随机变量 
的情形.至于总体是随机向量或随机过程的情形，私后有“多兀统 
计分析”和“时间序列分析”等课程专门进行论述. 

I w 一 r " 1 r w IM ? j-n b . 、 f “ Aai 人 ati -feH - r ^ - w * 44m * / ^ rt-L - r : t /^： 4 -rt r^-t 曰‘ tr*£t 4 -rt 

以以 wa > ca 戈:里刀 lyur 却石丁垂平 m ; E ;、 人 j 丁眼似 u 口 j 里、 wai^L 

过程的情形可倣相仿的讨论）.肖总体用随机夺量 X 播沭时 ，X 

▼ P *■ _ ▼ m W ▼ 9 • ^ 零 P • ― • r - "W ▼ ^ ~ ■ ▼ W 9 /■ » "W W V 卿 ， Wi ▼ 

的分布函数 FU ) 也称为总体的分布函数. ； 要了解总体就是要了 

魅: a ： 斗布 函敎女齡裀鲚补登由.斗布涵救 pyy 县去 钿的 .研窃 

n4 I v 、 /v ■ 厂 ^✓v • i-i* ， I v I 7 /v f ▲ v ^ v 7 1 / u 

工作就是要对总体进行调査（或观测)并对调査来的数据进行科学 
处理，以便知道 F (: T ) 是什么样的. 

怎样进行调査？逻辑上有两种 方式： 普査和抽查.普査就是 




对总体的每个个体都进行调査，这种方式有很大的局限性，当总体 


包含的个体数相当大时，由于调査工作量太大而难以釆用；当总体 
包含的个体有无限多或对个体的调査具有破坏性时，根本不能采 


用.另外一种方式就是抽査，即从总体中抽取若干个有代表性的 


个体兄，^，….,；^(这里 X ,是第£次抽取时得到的个体的观测 
值），（不，… ，尤） 叫做总体的样本， w 叫做样本量或样本大小.怎 
样抽查呢？数理统计学中采取“随机抽样法”.即样本中包含哪些 
个体不是事先确定的，总体中的每一个体均有机会进人样本.，在 
数理统计学中使用得最多的是“简单随机抽样法”..这个名词有两 
种不同的含义其中最常用的一种含 义是： 它是这样的一种抽取 

> - 、， j 一 少 t t \f A 咖 , • 丄 H X * w 丄 、 i H w • I—r I 瘺 ) /二 

万活，便恃 Ai ., — , A W 忭刀 n 魄机艾重 _ 柑丑骒 I 的， HO 丑勺思 
汰右相固的概銮公布 _ 汶釉烊太卩 U 做“简里随机烊太 

丨 ■ I -* I *-1 » ^ *-• V I v^i* I » I II I I irxv I I I vr ** t f ' I ■ 

蠢 - • 、参 • 多 W • ▲ > ft—f _ • / / n - ^ P ‘ ft V , |_ —• m * ■ t * t 、 _ ' • i i 會 ▲ 

怎枰孑能得到”简早腿 机样不 "呢？有网 柙盎不 万法. 0； " 有 

放回地逐次随机抽取法”.总体中的每个个体都有同样的机会被 
抽入样本，且每次抽出的个体，在记下其值后，还要放回到总体中 
去，以保证在下次抽取时每个个体仍有与第一次抽取时相等的机 

C 

舍被抽人样本.随机性表现 在：样本宁包 含哪些个体，#出自机 
会，而不是在抽样前预定的. ， ② 对总^ X 进行多次独立的重复观 


测，这时观测到的值可弘看成焉总体的所有可能值（无形地存在 

\ 上 a /v /t%f 上 " m /)# rut -ti- rfju /-X* 上 “ cte 、斗 b. rcix 

有一邵万 • 例训用 1 乂荷 々 J 禾—脚件义 进1 了根街測里，伐 1 IJ 

杷沏 I 量结果看成随机夺量（总&可想像为一切可能倌的集合，例如 

▼ 丨 ■ 『 , • ， ，，， ^ v ^ 一 —w W ^ w ▼ r ▼ ' ^ ， ■ -w w ▼ - ▼ ' ■ *»■ v ■ ，— " 

✓八 、 — Ilk - r . » I , 上 h A>-* 入、 _Lrr» —r ■赢 A=^ 、 ia.l 上 L tXl 、一 t 、磬 ， ■« T 4 y 

㈧ ， oo ) 驮史入的果甘 ）， JCi n 汄里里测重的珀禾 K ： 刀 Ai 
咖俱剌笳鱼随机烊太 _ 


我们强调指出，在实施抽样之后得到 n 个实数 


00 \ 


f 00 n • 匕 


①在总体只含有限个个体的情形(如有 N 个个体)•，“简单随机抽样法”往 往指: 

从总体中随机地抽取 n 个.这里“随机地”含义是 .•从 iV 个个体中任意抽取 n 个，共有 

' ■» * 

r^s n 入 -=-r ZU^L 丄 X* aa .Ll> n U Jj4 Mfr 丄 X* Jmr trfcrt -4m n ✓ fl H 一 1 、丄 n -r* 丄 L rrrt 丄 X* -LX. T3U >fn -r^l 

° j 眤 tfj ^ e 禾，； ii 空坧禾节和寺 tfjm 平，邵定、达定兀双凹 trj 畑取汰，待到 

^样本（V,…，; Q 不是下文定义的“简单髄机样本”，我们称之为“单纯随机样本”，以 
示区别.对这种样本，在第八章中进行讨论. - 




们分别 是 ，…， 的 观测值，通常把 A ，…， A 叫做样本值，也 
简称为样本.为了使用方便，同一字母有时代表随机变量，有时代 
表随机变量取的值 • 只 要看清上下文 ，是 不会弓1起浪乱的.望初 


学者加以注意. 

-A- ^44* vV -4 - nr AfA: XMt 4-rt J4A -ir- ” rw 匕 AfA: tr^ +rt 4*^A -A- -=fr 4*^ -ir- 

+ w 入土女 ii 7 f 九问平腿 似 l 忏平 ，以 / 口问件 wamir 平现忏午. 

数理统计学就是采取贿机柚样法获取样本，并从样本推断总 

^ 严 — ^ ，■- W~ F V ^ w~ V , , — ■ ~ w 9 ^ ^ — w m , ▼— ，•- 

体的性质. 统计推 断的类别很多，主要有两类，一类是估计，另一 


悉县櫥份炝验下而县汝而苤 IB 1 M 的一此摁法 

〆 ^ IL-^V --V ”“ • I >>*— 4^^ 【 ' 濬 -J 9-f V -Ar*^ • 

! 估计. 设总体 x 的分布函数 FU ) 是未知的，如何根据样本值 
A ，…， A 给出 F ( x )( —切 X )的估计值？ 


设 X 的分布函数为 FU ，^)，0=( A ，…，心）是未知向量，如何 


扭似任士估丄山加 
mwT 卞千 但 1 口 h 山 

更一般地，设 g ( F ) 是分布函数 FCr ) 的泛函，如何根据样本值 

、 t 

丄 f 1 1 / TT'X r% 

larym g^r j ： 

设 X 与 Y 县两个相百轴 tr 的随机夺畺，加何裉抿 （ X , Y ) 的样 

▼ p 9 w — « ■ » ■ • ， p w ▼ ▼ f ^ -置丄 * ， ▼ _，，■ ▼，r ’ ' ▼- ▼ w w 

本值 O! ,3；!) ，… ,(x n ，％) 估计概率 P(X>Y)? 

芸 Y , . .…县 一+ 瞄和岗初1.加储枏捉？ T , .….父的观涮值 

^1—1 ▲息丄 7 ▲ 办乙 7 ysi* | l^u- 1/ U / 4 # 7 v^r -1 | F g ii^v 4/M - * l 7 7 - 息 n m V i/v# l-a. 


Xi ^x 2 


n 预测 x rt + m ( rn 是正整数）的值？ 


估计问题是多种多样的.我们把预测问题看成特殊的估计问 

题.估计问题的特点是找出合适的估计量 〆 兄，…，叉），作为被 

• « 

M-JiJL ^th /\\t /*. 

I 口 H 里卩 、 j nwua. 

假设检验. 设总择 x 的分布函数 fu ) 是未知的，式是一些 

I 

/ V -A—- rr^. An JM ys^ »、一 t / \ -ar* —r* ^ — t>-^ / art /tn 

ar 叩田奴 班； j 乂 try 釆百 • i 口 j 、： r ; 定甘牌丁々了现百 pj 有広 vkhibi 

设） 


F ( x ) e^o (2.1) 

县本可按琢？奥*0坦 Y 的迷:*:倌 …1 給早昍偷的问笼： 

P— I ■ ^ • -^s ij^. 4/m ▲ * m v I I ' 丁 ， irx 山 丄 7 7 *^rt j /j •- »v »~~• i—i • 

换句话说，在 r ” 中要确定一个集合 wczw ，当(^，… 9 x n ) ew 时 
拒绝看法 (2.1) ;否则，接受看法 (2.1) ,这个 W 叫做否定域.怎样 
选择合适的 W ? 
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设 X 与 y 是两个随机变量，它们的分布函数分别是 F ( x ) 与 
G ( x ). 问:如 何根据 ( X ， Y ) 的样本值 (A ，: ^ ) ，…， (A ，: y „ ) 判断 X 与 
Y . 是否相互独立？又问:如何判断是否成立 Fix )= G { x )( 一 '切 ： c )? 
假设检验问题的提法也是多种多样的，在抽样验收、科学试 


TtA wnt i ~~ > -A* >rv.t 1 八 AA* >ft-f r_tv . I . l~rt 

狸、 M 重苜埋、氏葸测诞寺很步锁壤屮安用到 • 

诵蚩餘佳太 I Y 的涵粉 cr ( Y , 铱鲁.汶坦 

1rvj’ | | ' | ， ▲▲ 丄 7 7 ▲ i n m v ^ -^u w % y 

g 是完全已知的函数① ，一 旦样本 ，…， 的值取定，统计量的 

汝油 i 、 r 检山士 7 士丄 i、：n mr m /4- j 丄县油曰缺让且女加瓜认 
但 肌 hj 以井 oq 不 J • iddn 口 H 1叫趙壬 ，I 口 H 里肌疋巩 H 里，狂 IR tscm 

验问题里，否定域也常由统计量表达出来.把祥本看成随机变量 

w w ^ v ， , ^ _ , t , ’ • — • _ w ~^r w w _ w v f • ■*■ 

时，统计量也是随机变量，它的分布有时叫做抽样分布. 


估计问题、假设检验问题可看成是更一般的统计决策问题的 

b _ - k m b . ■»■ ▲ 赢 •皿 倉 ▲ a. k Mi am w - - — ▲ 秦 ▲ ▲ ▲ • 鳥 - 

特殊情形.在苐七章中对统计决策问题有简单介绍. 


3数理统计学发展简史 


数理统计学的发 展太致 可分三个时期夹叙沭 


A » t I # » k • 、/ _ v ^ ^^ \ t w / __#_ # . t # > v ^ 詹 / I # _ i 

wis : 纪以前，这是奴埋统 tr 字的明牙时期.在这搜长的时期 

里，描述性统计占据主导地位.描述性统计就是收集大量的数据， 

■ 

并进行一些简单的运算（如求和，求平均值，求百分比等等)或用图 
表、表格把它们表示出来.中国古代就有钱粮户口的统计，西方国 
家也多次进行人口统计，早期这些统 计土作 都与国家实施统治有 
关. 统计学的英文词 statistics 源出于拉丁文，系由 status (状态、 
国家）和 statista (政治家)衍化而来.这时期也出现了一些现在仍 


▲ ‘ ♦秦 、备 V _. m ft # _ ^ V. * * 身 -- _ to b • ‘ ■.龜 ▲ 、 w _ 

很常用的统计方法，如罝方图法.但最重要的、超出描述性统计范 


因66赤故且食法光工县/ I 、一 ■吐 的丁你 女姑 斗田拍 卜 

m m v /jyu/tt irj 79i，i h 刊 w - 卿 w j 上 id ，一 ^yr^ux ny -l* i r • v i 心、 / 必」一 

〆 


①为了进行严密的数学研究，通常假定 g 是 Borel 可测函数.学过实变函数论 
的读者知道, Borel 可测函数是极为广泛的一类函数，我们在实践中遇到的函数一般都 
是 Borel 可测函数. 
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的重大进 展是: 数据是来自服从一定概率分布的总体，而统计学就 
是用数据去推断这个分布的未知方面.这个观点强调了推断的地 
位，使统计学摆脱了单纯描述的性质.由于高斯等人在误差方面 
的研究工作，正态分布（又叫髙斯分布）的性质和重要性受到广泛 

Tf% 上 fit -I r\ 1 1 L A—t ■ t * I-4-* v^i / T, -t ^ r- r» 、 41» •' ^ 人 til 

Ml %. 丄 y lEJC 木 rearson, 丄 CD/ ——丄 ydOjjlia ： J: 一 q 、 以 
他的么穿命戈的 4 V 布旌.女初会了 TF 本布菸现在 P . 知的 y 胜莆 

I ^ ^ ■—i ^ »—i 9-9 V • I，"/V 7 ■ ' A »~« W 11* / 嘩 ，厂 h M * 1 ■ • y V ^ 

要的非正态分布,扩大了人们的眼界.皮尔逊还提出了一个估计 

方法——矩估计法，用来估计他所引进的分布族中的参数. 

另外，德国的大地测量学者赫尔梅特 ( F . Helmert )1876 年在 


研究正态总体的样本方差时 ，'发 现了十分重要的; t 分布.高尔顿 
( F . Galton ) 在生物学研究中提出了回归分析方法.这些都是数 
理统计学发展史中的重要事件. 

20世纪初到第二次世界大战结束，这是数理统计学蓬勃发展 
达到成熟的时期.许多重要的基本观点和方法，以及数理统计学 


# # 、 . 身鼇 丨 „ W # t * # .、鲨 M 4 __ . » * * - - - - ^ t . # * # # > - * 廖 1 

的王要分叉字料，郡是在这个时期建立和友辰起釆的.在具友辰 

由 【 M 典姿 A T 7； c u ^ 1 eon — 10 ft 9、士仲主66苗®每郝右 ■ 

I ， v^y\ JAV n\J /J > V ▲、• i 丄 j 丄 ^ %j \j | \j 1=^5 ~T~ AtSJ 

j 主导的作用. • 

K . 皮尔逊在 1900 年提出了检验拟合优度的; C 2 统计量，并证 

• # 

I 

' o * 

J >• 1>1 t # l I ▲ / M ^ I_ p _ A t 、 « ^ ^ t v r—t i p \ .# ▲ jl / i. t 丨 I \A > _ > >- 

兵极限分伟 C 在原假坟成立时）是 Z 分帀.这个结罘是 X 砰不犹 

' / - 

4+的忠販处丁你 9 n 9 n 佐伴弗姿斤矽你了舌亜锆眭 

y I h v y uj*^*-1 i_l- —k- I r • ^^ lel ~i~ I Vi 卩 aj 、 I r J ^ • 

紧 接着的 一项重要进展，是皮尔逊的学生，英国医生戈塞特 

J> » 

# * 

O 厂 '_ ‘ 你办“私山 ” 、 in 八 ovfcirB 山 7 ^ Jfcfc _5 丄且 A/t 姓成八 

O . VJHJSStH ， 书 由子土 7丄 WO 丄卜寸 OQ J 【巩 H 里 tTJ 怕洲及 


( W . 


布 


—— t 分布，开了小样本理论的先河. 

» * 1 * 

比皮尔逊略晚的费希尔对现代数理 统计的 形成和发展作出了 

畏士的舌献.他县 一 此番班钵朴斗古知士达的弈钏若甚莆萆的 

^ 'v M V 少 S 1»^V 7 — . ^±±. ryu r I /v r \ ^ /V MV y I ug ，只 • _=t^ -^S M V 


成 就有： 系统地发展了正态总体下种种统计量的抽样分布理论，这 

* 

_志着相关、回归分析和多元分析等分支的建立;建立了以最大似 

• * 

然估计为中心的点估计 理论; 创立了实验设计，并发展了相应的数 
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据分析方法 一 方差分析. 

在数理统计学的另一个主要分支——假设检验的发展中，费 

类斤 j+r#3 分舌亜此田 /PT 庇瓜换 B^TfflA66 玄始 iUin 范人 UC^r RIH irtr 

^ ， J 、 LCUACii 虫 ： 5^ I t^m 9 |i=L I pc lit riisfc-^t KU 7JS ^；U rU ， I’H VT ^/、》 V| : TU ， WJ/J!L 

归功于奈曼 （ J . Neynian ，1894—1981) 和小皮尔逊 （ E . S . 
Pearson ，1895 — 1980). 他们在 1928 — 1938 年期间发表了一■系列 
文章，建立了假设检验的严格数学理论.奈曼对数理统计作出的 


另二项 很重要的贡献，是在 1934-1937 年间建立了置信区间的数 

举 理讼， 贷某干概銮的麵銮魅経 .# 与奋晷-故尔狲的櫥份給賒理 

， ，星 _ ^ I | W -9 ^ | / ^# ■ I V ，，膠 寸， ' ，， 尸嗎 J ^ ||^^ “ ， ■ ■ _ 


论有密切关系. ；， - 

多元统计分析是数理统计学中有重要应用价值的分支之一. 
1928年以前，费希尔在多元正态总体的统 tf 分析中作过基础性的 


工作.1928年威沙特 


( U . W . Wishar 


导出了著名的“威沙特分 


布”.此后，这门统计分支发展艰快.我国著名学者许宝騄 

1 r\r7r\\ 、rV 々 K? Jefe "r TL Z»A UU 4^ ocil |4A J 丄 4rf?r bkt ： TW 公人 /A^ ift 一 ^ 

一丄 y/Uyrwj 込一观桃以从软 T 土俠至 tnj 巩 K| 低 IW 牲 T 匕， TFDQ J 


、丄3丄 U 


奠某性的工作.时间序列分析是数理统计学 中有重 要应用价倌的 


又一 分支. 尤尔 （ G . U . Yule ) 在1925 — 1930年间引进了自回归 

知_ 利栩 羊笺亩 恧獬今 .酋宙了汶个斗古视仵发瓱的其础维劬 

'f / -4 ，矽 -^S IT^U 7 I ^X»V ^ >0"W /y^ »-• V r ~X~^ nun ■ <# 

( N . Wiener ) 在第二次世界大战期间为研究大炮射击问题而提出 
的时间序列分析方法(外推、内插和光滑化），不但对炮兵而且对整 
个工程界都有重要 意义. 瓦尔德 （ A . Wald , 1902—1950) 在第二 

次世界大战期间提出了序贯概率比检验法，不仅在实用上有重要 
意义(例如贵重产品的抽样检査与验收），也为战后序贯分析的发 

» J-^ ~Z^ H=l* V>lt 

肤吳疋』承仰 i . 

如卜所沭，亦孜不到半个世织的时期里，救理统计受得剞了东 

， ， _ ■ p ， f R ■ • - — r ▼ ^ ^ ■ - ， • ■ ■ A - ， ■■ P ^ P ^ ^ ^ p 

富的多方面的发展，确立了这门学科在人类文化史上的地位.克 

始臌 rrampr ) 女 ^ QAf ^ 生踅的女蒌“雒朴些:的.粉登古银”材汝 

g-=i* J»y V \ i ▲ V * V I M v ^1—r -2/U , ■ —厂 M v .PVV 4 ^ 

一时期的主要成就作了扼要的总结，是此后 20 年闾数理统计学的 
主要教科书. 

战后时 期：在 这一时期中，数理统计学在应用和理论两方面继 





续获得很大发展.在应用上，由于经济和军事技术的快速发展以 

v to ▲ _ A ▲ — >_ * * ▲ ^ ^ 轟 _ » •‘ • M ^ k A * A ^ -. to 、身 ― __-* . ••秦 A • 

及电于计算机的出现，使数理统计学的应用达到 r 前所禾有的规 

进 右此璧亜+县々+曾66姑 ■}+ 七吐女 Jbfe 命 KH ^ P 欠/止而午吐估田 

7^ c « n mj ^ryvs v i ^=fr wj</uki yv ia > uuha ^ 卩 u n ^ j 亦届 i i»m / m , 

这个障碍今日已不复存在.•统计方法已渗透进各种专门的学科领 

^5^ f )Y^ i WMJ. ，义 W SHj V I /JM S . 目 > ’ 十 - 155J/ ^7U H 、 、沒 Li 务 I 、 

地质统计、计量经济学、医学统计等. 

— — - -■ ---- ^ » »■ r T v 

战后的统计理论沿着纵深方向快速发展.例如最大似然估计 

和韭叁救統计的女榉本理讼.亦战前 R 右初舟的结果.现 R 扶剃完 

• ▼- , ■ m ,_ 「"•，，，,_ | ■ • w , I * • ■，寸， 、 ,相 ■，分 ， f "* , , - , ， ■ — ，一^ 

善的地步.瓦尔德在1950年创立了统计决策理论，它从人与大自 

然进行博弈的观点出发，企图把形形色色的统计问题纳入一个统 

* 

一的模式之下，这种理论对战后数理统计许多分支的发展严生 r 

iH -4 -SJraJn 

IJJC/V 取 ， ITT 刀从 114 少 1 垃 I JJ 入 * 

随着概率论的高速发展，随机过程的统计逐步形成了内容丰 

A/t / V it* ~ti* r~h 一 t* ^tfe ~Ftn ) 人卜 -fefi?. ~H Q A a Aj^ 

m WjrniSCTT^ 升 1 rqF 级 T±i® 讽狂 Ri 口 »5 J 亚百 JlSilJL , 匕疋十 

代维纳-柯尔莫戈罗夫滤波理论和 60 年代卡尔曼滤波理论向非线 

w -^m » » » r ▼ ， ^ ~r ■^r - •• ■ w m w ▼ ^ ▼ - ▼ ，■輕 — 

性领域的扩展.前苏联学者李普泽尔 （ R . S . Liptser ) 和希拉也夫 

(A. N . Shirvavev ) 亦1974玍写的告荃“随机衬耝的统计”系统论 

' ——▼ — ，， — r — — »—〆 — j _ ， ， fc i - — ^ ^ — ( ^ 門 ^ ^ w | * - r^ ^ W , ■ w , 

述了这方面的理论. 


在战后数理统计的发展中，一个引人注目的现象是贝叶斯学 
派的崛起.这个学派的思想可溯源于1763年发表的著名论文“论 
有关机遇问题的求解”.论文的作者是英国牧师贝叶斯 （ T . Bayes , 


1702— 1761) .这篇文章基于归纳推理的思想，当时未引起多大反 


nrfn +rt rA- 1 n /\ Jtr^ -^G* ^r* Hi -l*-i I A>-t JC»A» A4 - o r\ />—I r r\ Jbrt /Jx IV t -rfr 'r\* 

即 3 ，邱仕丄干 / 口里研 ） 1 胚八 lutrjtt 思 、 • ^ itL^c ： okj 千 1 、以；，込 

个学派的兴起不县没有原因的，传统的统计举发展趋于成孰并得 


到大量应用后，其固有的弱点幵始显露并逐渐为人们所认识•传 

铱錄朴古浓不能奋从剎田计古怒賒葙里益本的铀祖 .女 A 摄太 mi 

， • wu / u 4 / w ^Xr -c-i* ，■， 、 ， i 、 h w / ， r» v ^ y ^ » i • i i ^ 

里表现出难以克服的局限性.这一点在可靠性统计问题中特别 
突出.而在贝叶斯学派那里，却有独到的方法，利用过去积累的经 


验，在应用中常得到意想不到的效益.虽然如此，实行贝叶斯方法 
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仍存在很多困难，先验分布的客观性常引起非议，贝叶斯学派的观 

h w k ^ ^ 叙 k ^ ~ *, k . ■ I ▲ . k & ▲ a b ▲ w & & 

点还 难以为广大统计工作者晋遍接受，贝叶斯学派和传统学派的 

' - 

4&^ a / r 收 k ttn 方女,讲 n 益遥 >□ 布古 p 本-^女 p > nx /^ 工古 wp 
vu yj tt j-v?jQ-rr "tm pi wj ir uu hu pi ， / 口妇 八 rr 丄 i/j ^ j ^ wu 

地位. 

t=l 』丄 A A 似 ra 山 T7 a ^ttr 4di 上：白 rhf <i 丄被 士 rt A/t r^ CVoC / 士 

f »; 口双往肌 H trj 汉; tkt 入一亚百付 m 疋电丁" 弁 vlovj lie 

用.这不仅使得过去难以计算的问题能够解决，而且促使能有效 
地利用现代计算机强大计算能力的统计学新理论问世.自助法 

(hootstrpm) 知扮影寻瞭法 （nroiertirm mirsii 彳 t ) 就县统计受丁作去 

'一 ▼，一 一 _ — ^― , ■ ■ , ' £■" 一 ^ j 梦，▼•一 一一 '― — 一 •— • — , u , I ■ ♦ i I i—§ 

颇感兴趣的两种方法.1980年以来，对它们的应用范围和理论基 
础，，统计学家做了许多研究工作. 

以上对数理统计学的历史作了简短的叙述.读者如想知道更 

少66 ffT 出 4 cn 々 a 洁矣毛 Itfc 本逸龙： Aft // 谢 rXH ' 社）本砂你 cb \\/她由 4 fifr 古山 
夕 py /at 入力 h P 、 ，旧罗书 r^h^rp ]rm 书 py v\ 于 i«j 入//、1抑|干 j 议闩 uli 

版社， 2002). 
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§ 1 参数估计的方法 

估计问题是多种多样的，很难纳人一个统一的模式.本章讨 
论的估计问题的类型是比较简单的，首先讨论总体参数的估计，然 
后讨论分布函数、帘度函数的估计： 

」rL 丄口 *5^ 白 - xr 上 x* y v j=? / /i\ r7^ —Vh -tog* 

a yr ^rp 田纸定 r vx , c ^, 世反 es 双现 m 平 bh 双 

是 /( xd ) (当 X 是连续随机变量时，/(工,们是通常的概率分布密 

> ^ f > -w v j— » 、 * -LLf . f I I fe-» ^ - 一 象 八 / a v j~» I rrrw* 方 - — . r~l r-t t t* /■ I ■ AfJk m ■ ■ * 

皮；彐 A 是呙散魄机父重时， / U4 ) 是概半凼奴，即 A 取俚寺卞 ： c 
的挪來 V 甘由 fl =( f ), 』一… ‘ fi 彳县去 4 n 的糸粉 （ 向鲁 k /9 的一七 7 TWT 

M V 1^1* ~ | ~， 7 jA N I v W 1 7 \J £, 7 ， W 79 %， M V V |' g _±±^ / 7 v i-v v W W 

能的值的集合记为0，这个 0 是 m 维欧氏空间的已知非空子 
集.设 g (仍是0的实值函数（通常是连续函数）. 问：如 何根据 X 
的简单随机样本工 1 ，工 2 ，•••，•!：„ 估计的值？ 

例如，设 X 〜 iV (^，( T 2 )( 正态分布）， p ，( T 2 是未知参数， (?= 
("，( T 2 ) €@= (―° 0 , 00 ) x ( 0 , oo ). 如何估计 P ( X > C )? 这是上述 

类型的问题.实际上 P ( x > c ) = l — 这里少 U ) 是标准 

正态分布函数，即 

1 „2 

步（ X ) = - e _T dw 

J _ °° ^/2 iz 

估计的关键是如何估计 A ，氏，… n ，若它们的估计值分 
别是，…，沒 m ， 则容 (沒1，沒2，…，沒 m ) 就可作为尽(夕)的估 计值. 

如何获得卜⑽，<9 2 ,…， I )的估计呢？方法很多，最重要最 
常用的有两种 ，一 是最大似然（估计）法，另一是矩（估计）法，分别 
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介绍 如下. 

m 秦 _ ▲▲峰 m ■- ■ 

I ") 最大似然法 

4 士且基々龙 1 ^ 1 姑 4 +每电 P A TT ; oU 价女 1 Q 1 9 体坦山‘沿 

1=1 ZT^Z « </L* y I 丁 外 、 ▲、• 2 上 lon^A '|_L 丄以丄 “ —f 4AC 114 MV • 

X 的密度函数（或概率函数）是 /( x ，<9)， 则简单随机样本（兄， 

V …V、 Aft 併八 <ite 由 -TE ： *fr / 士 ttt 由 .TK <tfr 、曰 
八 2 ， … ，八 ^ 卩 :/ 职口瓜戊田又足、现佩千 1^ 双/疋 


Lh ，…，：!：„ ;沒 )= JJ ① /(工‘，0) (1. 1) 

X = 1 

当（兄，…， X n ) 取定值（:^，…，工„)时， L ( xi ，…，: c „ ;沒)是沒的 

函数，这个函数叫做样本的似然函数.若 ，…， A ) 满足 

▲ 

L { x \ ^ ••• fX n ； = sup L ix \ ，… ，: r „ ?夕） 

eee 

则称 ^ 是 e 的最大似然估计②，也称 s 的各分量是 (？ 的相应分量的 

也 4/1 、 / 从外 4 丄 
取八 l!^WI 卩 H • 

山下记 •••，〜； (9). 由于 lnx 是） 的严格增函 

-UU t / r\\ AA B _J_ Ht^ I- ^ .U S 1 r / r\\ 上 A 白 _J_ Hk^ I-* ^ hU 4-4V B _l_* 

戮,队取入但 m am 定 inhvc ^ trj 取人但显.芯忏不 1 守取人 

似妫估计 6 呢？当叼县开集而日 lnL (/ 9 ) 的偏导教（导救）存亦时， 

I v # « v ^ p w ~^ ， ■ — r ， ■ 1 ，^ ，， ■ ，攀 v * ，， - -—— 、 ▼ ' ▼ r __， ， ^ 9 ^、 、 ， 一^ ， ' p ^ f 

从微积分知识知，最大似然估计 S 应满足方 程组： 


Pin 1 ( ff \ 

V AAA \ lg/ / 

一 T 久 


0, 


• • • 


rl\n 7 ( 

v ‘息丄 V V y 

30 m 


0 


( 1 - 2 ) 


(1. 2) 称为似然方程组.从这个方程组求出根后，再判断根是不是 

v 1 

/i\I Jbli AA 曰 - —L- 0i4 - J±C^ \1A r / r%\ 一 r" -fe -A* /db f=L Tfff -=tr 

1 W 热田双的取今但无 tt 思：曰1、什 tt 綱开似 tt 、 j ，而安且 

栳研究 LO )， 导找最女倌点. 

^ ^ W ^ — ▼- ^ - WT ▼ ^ 一 - v ， 

* * 

> ； ■ 

C=t r t、、t JuK . / 曹 i L*-r 渣 *- • ca / t .，歲 <"rt r~g"t I /»v» / L 、丨 A. _ >•■ 為 .«<tx 

最 x 似热怙 rr 的恨诟定 rr 么？米历敢 tc 似然 tstt 甘埋鸣？茯 
们本老由-^小僚鱼的棺没，個奋 一 小金罕坦右白接/里谜 : tt ^个. 

II - 4 ^ 1 ^ V 声 * I VI^ —1~ 9-9 v I rj • * ll^v I V IJ I—^ v I 7 

但不知白球、黑球各有几个.如果有放回地从盒子里抽3个球，发 
现第1、第3个是黑的，第2个是白的. 问：如 何估计盒中黑球所占 


① 在不引起混淆时可简记为 II . 

1 

② 为了便于数学上处理，我们要求$= 〆 々，…， x „) 是: n ，" •，: r „ 的此出可测函 
数，这个要求在实际工作中一般都是满足的. 
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的比例 0? 不难看岀的可能值的集合 0=| o, 备,寻，1卜从盒中 

\ ) 


有放回地取球，第〗次取出的结果记为 

x 一 ! i ，取出的是黑球 
I= 10,取出的是白球 


( z . = 1，2，3 ) 


» J ( X 1 , X 2 ， X 3 ) 的联合概率函数为 

L(xi 9 X 2 ^3 ；^) =^l +：r 2 + x 3 (1 — 沒 ） 3 一 (jr l +j 2+i3) 


— 、 

〔这里 A = 0 或 l，i = l ，2,3). 

当（兄 ，X 2 ,X 3 ) 取定结果为 : ‘第1、第 3 个是黑球，第 2 个是白 

球”，即 A =:c 3 = 1， jt 2 =0时> 

r / n\ — zi2 /1 n\ 
l^\UJ 一 （7 VI 一 UJ 

I 

是盒中黑球所占比例为 (9 时，事件“第1、第3次取出的是黑 

， » 響 » 眾 ■曹 ■ - - w ^ 罗 w ^ m •w v 

I » 

T-U AtAc rfc \/L^ • f > 丄 “ n ,, J.U Jua* rJtf t-»_L r\ 上 “ Jh* -r 丄 ~=T t±^ 、-^人 

坏，乐乙认取 mtrj 定 h 坏 tfj 慨半 • au jk c/ trj 脊 wki 目 b 但 , 込 ， riw 

* 

^加下， 

I - » ■ 


r\ 






A 




27 



土 

27 


A 


既然“第1、第 3 次取出的是黑球，第 2 次取出的是白球”是已 
经确实发生了的事件，故与这一事实最匹配的 (9 值应该是使其出 

现概盡取暑士倌的 A = 沧就县 A 的甚士似妖估 i +_ 

fV；«* I - K"、»-• V ^ Q ■# * .1 ' 4 ^ W vr r-» V ^ ^ W »、、 I •—» ， I * 

ij \ 

h 決 4az® 白 … 壬 田本 ; tc/sriir 撕補 練如亦县樓取 获们冰 HT 麻 

一 l* 尤 l;; rm 十儿 4 ■丄 i”j 阿职迅 r«a vi> 乂里 m ，口 ' " j uii 供 

广到有通常密度函数的情形.设观察到样本值不=力，…，足= 
心，实际上表明观察到事件 A={Xi e (%—心 a +幻， …， 

(: c „ 一 S ，: c „+^} 发生（对一切正数幻.易知 

■ • ■ • ■— 一 *■ - ■» •w ^ 




PCA) = 


Ji 




—d 




〜” + 衣 - A - 

n TT " 


工厂各 


丄丄 f\U{ ^u/Citci ***(111„ 


^ L(jci ，•••，:《:„; 沒）（ 2 占广 
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參 


(当 8 很小时）可见，若用最大似然估计 (5 代替 0 时 P(A) 达到 
最大. 

^ 1 1 ■ 

iw u 且 u 古 u 畑姑且 2 士灿 as: 由且 I 
m 丄疋 /yvja 肌丄杜妍取 y 、 ikAwi 口 m rrj 口杜 1 工》 込 rrm 干取夕、 

原则是一种朴素而重要的统计思想 ，应用 很广.数学上可以证明， 

-^r- Af /fl* -T* / 'tV iUU. At I$X* r/r- — L* 4^ rhr^ tt=l -r* /Vt - 山 曰 Affa D AA \ n TH? -I4A 

住一疋求 rr 「、込竺求 rr 仕人夕似大 p 小丄疋 iw 疋 try, ，只安忏 

本量；2 足够女 ，最 女似棘 估计义与直倌0可相差仵竟小，即对仟 

• ▼ P V , ▼ * v f W » ， p _ r 丨 1 - ▼■»•-» W 

意 e >0 有 

lim P ( U . —/? ll<m = i n . 

• —— — — ■ x \\ ^ 71 v || ''•v* 分 , — 、一 

n—oo 

诗宙113 乜象的昍苗「晚氐昍兹） hk n U 亩 3S 的板 

- \\^ ft V || V M V — r^TJ \ «-aKV — V -^ • ^ X M v ■—^ 

质是 

PClirn 6 „= 6 ) = 1 (1.4) 

oo 

0\ cfr TV ^ s zfc/^1 yl 、 ri>TV ^ 

、丄 ，/ M ^4 , Ad 巾 n 1 口口 I 工 > V 丄 • - 1 A* , Ad ^ n 

t 

强相合性.这方面的一般理论需要用到较多的数学知识（如测 

〆 

度论). 

下面通过一些例子说明最大似然估计的求法与相合性. ' 

/ 1 、 .1^? /V -A ■ / » 匕 -n^. /Jt* /#ty U / t~\ 11 • x / V -A ■ 、 

、丄 J 网思 or 仲 vm^MH^^JVCernounuar/fp； 

设随机变量 X 取值 0 或1，且 

« 

/> = rCA = l) = l — rCA=0； 

不县 Y 的撫农菡粉县 

4 “ M V l»TU-T - 

s 

P(X = x )= p X (l — p) l ^ X y (JT = 0，1) 

甘 cfa 表土 An 表 [「n i n 1 、旮进 * 且 Y V ... v mil/rw 彼冗粉且 

^r y >1 、力 h j y l v ，丄 」 • ^\ ，乂 2 ， ，山 n ,wj ccixA/t^ 

» 

W n r 

，…，： r”；/o = — />r— x : = /> 十〜 u — prr 十〜山 

*=i 

取对数并对 /> 求导后知 > ==无是唯一的最大值点，即它 

n 1 


n n 

爪 V '- H V ' 

w / j^i 疋 7 ^ 

1 1=1 


Xi 的 简写. 
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是/ > 的最大似然估计.直观上，如果某随机事件发生的概率是/>， 


则在 n 次独立重复试验中，此事件发生的频率为丄$]心^=沁正奋 

二 n ^ _ 


是最大似然估计.由强大数律知 > 有强相合性. 
/ 0\ 

W JSyOLTTW 

% 

密度函 数是 


… 、_ W ， ^>° 

j \Ji — \ 

In . ^<rn 

\ vx 7 v 


其中 A 6(0, oo ). 样本 jc 1: ，: r 2 ，”•，：!：„ 的似然函数为 

. 、 

* * 


工 b 

丁疋 

V . 





din L ( A ) 

^ r 

QA 


n 


7 ^ ~ 


A 


故似然方程的 «/2'^ - 不难看出 a 是; i 的最大似然 : 估计. 

1 


.Vi- M /-^ AAt Ua ^ll ，一 1 #->- na A-n t m -nu -Lrt 人 /.A 

tt 思思件 trj 默子朋里力 a _• w 放入戮伴;定 5 虫相百 trj . 

s 

All 1 . 1 R 铀苴轴由罕份容的俅 fe 妄 ‘ru 芬始缺由到生放 

•^睿 — ▼ 一 ，■■躁，、 II »-M 1-^ V 1 、/ ■ 广 1-1 / 1^ 

I * 

为止)服从指数分布，密度函数 /Cr,A)=Aei(x〉0，A〉0), 今随 

机抽取18台，测得寿命数据如下(单 位: h): 

\ 

17,29,50，明，100，130，140，190,210 

■ ■ > •' ， . 

270,280,340,410,450,520,620,800，1 100 
问：如 何估计 A? s 


采用最大似然法.利用公式）=-^,现在/2 =18,文；:^ 

1 

1 

▲ 1 
^ ^ A t.t ^ m. 丄 

^ /Z4 ^ A = 3 l 8 - 




(3) 正态分布 
16 • 



密度函数是 






e 




a / 

Y 編 , w 


其中 S =( T 2 6 (0，《 D ) ，斤 (-⑺, CXD ). 样本(值 )4 ，…，〜对应的似 

似 a^j^yv 


L(Xi ， … fX n ;/i ， tf) 


/ 1 ■ 

^ s[Hh ) 


n 


占 S 







n 


t? - rt - 

^ ln (27 c ) —子 In 5 


I V ^ 

二 > 1 

25 V 


{Xi —/i) 


似然方程组为 


dlnL 


a " = i 2 u-^)=o 


dlnL 

9d 


n 


n 





y ] — fi) 2 =o 


甘坦且 i = 二 、2 htih a^ ； 3 ： /hi^ 

JU — X i^i —丄，以— / V、丄I 丄 / • ^4 K^\ ^2L WJ- 穴、孓 ca^l 

n n 

r T^hL ^ f ▲ c^\ /t*L 、丄曰 _JL^ Htt c ： t-! IW A /V IHtl S cv AA 曰 _L^ Ml A*h. UU > L 

l 侧头住 v/i ， o 夕处公取人但 , /yr Ws fji^o yr 力 1 j 定 / / ， o try 取人 i 以於 iciI t. 

由于总体的期望 = ，方差 Var ( X )= EX 2 - ( EX ) 2 =^, 

% 

» t - %1^ 裊 ^ 1* 皇—一 v ， • / T \ v — ■ * 

从强 X 奴侓知 ruim 山 jl = fi )^ i f m 



txt -tci i ildL>x^tL iU>-i' 

丹邳用烛入舣伴沖 

■■ ^ _ ■_ w ^ O v • _ w w 、 O 、 ^ 

尸 Uim d = KX c — Cii'Ar ) = 1 

n 


故 P ( lin ^ i ^) = l .: 这就证明了 / ij 分别是 " J 的強相合估计. 

n 

(4) 韦布尔 ( Weibull ) 分布 
密度函数是 


/T\ 1 * Ml* 丄 “ AAr -T=f 

KV iim 定 um 的间与 • 

n rt —►cjo 

• 17 • 

















/( 工； 


//t 


J 


m 


m— 


ri 


m 


】 e _ (f 广， j :>0 


lo, 


x ^ S ) 


其中 m > 0 , v > 0 都是未知参数. 

样本 A ，: c 2 ，•••，:《:„ 对应的似然函数为 


/ 

Lim ^ rj ) = ^ 


\ 


m 


n 、 _a_ 

m n \ Yxr l 


n 


• e 


m 


E-r 


Wm.. M h W 

似然万桎组为 


din L 
dm 


n 


— win rj + 士 In Xi 

TYt i 


n 


m 


2 ^ j 0 cT\n x , 


*2 


j 



jn 


ill 


V 




Q 


Pin L 

drj 


n 



m 


V V 


m- 


Ylxr=o 


从 （1. 6) 得 


(1-5) 


( 1 . 6 ) 


n 


(~^ V xT ) 


m 


(1.7) 


A k k. ■ j ▲ —— «. ▲ 

冉代人 （1.5) 得 


1 I 1 _ 

- 1 -/ J 111 JLi — 

m n ^ „ 

S 工 r 


71 


n 




m In x 


Q 


Q \ 


一 ■* t \ t 、- r* rtn 、■/ r\ r-t — r ■* 人 _Lt-» AgV -■> . m / i r\ x 1 人 - ■ / ■ _ . 

円 以 lit 明！ i 彐 n^z a xi ，…, A 个生相守时，力往 VhW | 百仴 
一 个坦冷里 Fbn 7 MB 

I I • I ^ MH \ • ■ / IV# 


n 


a 




m 


V V. ✓ v * - * - # 二 # X * - O^/ - / v ^ C=t f /.v ■ / f - \ I y- ✓ 、 /rt 

这 [汾 ，以俚走节布艰甘布穸奴 Cm , 以的最 X 似然怙乂 
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是似然方程组的解，而且似然函数 L 在（价 j ) 达最大值！请读者 
自匕验证这一点）.与指数分布、正态分布的情形不同，这里的执 
没有明显的数学表达式，要找它就需解超越方程 （1.8). 由于 
(1. 8) 式左端是 m 的严格减函数，利用计算机可以迅速地得到价 
的近似值. 

数学上可以证明 ，仇 4 分别是 m 9 V 的强相合估计. 

(5) 均勻分布 

來麼涵救县 ' 


f(jo;a ， b) = 



a 


a 

其他 


«-4-> ^ / 曰 nrz 人 -4 - A^rt 也 

兴 T 定門，「不沖麥 


样本 

» W 9 


X 


X 


对府的似然函数为 


j 1 \ n 91 

LCxi ，•-- ,x n ;a,b)= j [[ ha.bi ( 工 :) 


、- rrt T ✓ \ I ■ - "L 人 T^f 上上 * - "L L#K 山 ,- / /— T^f " T ✓ \ _ -< rtJ* 

达里 衣 7 K 果甘 t HyTK 汪凼奴 m Le ^ x ) = 

/. rr ^ OV 不难砉屮. 

— a 、 —^ ^ ^ w ■ ，學 ■攀 / 


f 


L(j ： ! ， … ，： r„ ； a 9 b)=<, 


V 


jrt T-irk t^r\ ^ R 

\b-a) ? 〜总 


r\ rv^ o 'v 

IXiaA JL 

l^i^n 


Lo , 其他 

故 a，b 的最大似然估计分别是 a = min x { , S=max j :,. 

l^i^n 1 ^ n 

r . -=rr t\t >-t* tin 八 7 八 口 “ s t /./• ] 口 oj-t 人 > i tr^ i . )rL 

戮子工 Kl 以 lit 明， a,o yrm 定 a,0 虫 相百怕 TT. 头邮工，议 

I— ^ r / / \ J 4 H 1 - 4 -^ AA 八 - 4 r^ Z?Ti 41 ^ & / \ mil 7 A/* _/V -fr^ B T / \ In 

/ V 工； a ， C^>TBM ： trj9T4p EH 奴定 r KX)，mo tTJTT 叩幽议定 1_ 尸 、 J：>U • 

I 

J/T- r\ ^ ^ i mil n/ I r i I \ n/ 7 il \ 「 r ?/， \ ~1« 

vyL e ^ o — a^M \ o — o \ ^ e )= r \ a ^ o ^ o — e ) = i _ r 、卩 — e>u 
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= "，故 —6|> S) < %于是不;难 _ 知① 

' v _ a ， — ^ V •( 

P(lim 6 — 6) = 1，艮 P6 虽才目^" 白勺. 

n 

由于 

P(d <C x ) =1 — [1 — F ( x ) j n , 

P {[& — a \^ e) =P(a + e^4 ^ b ) 

=[1 — F(a + e)] n 

/, £ V 

= \ L ~ JT =- a ) ^ 

\ _ , -^ r / 

DO 

故 Y PC I a — a I ^ e) <T oo •干县 PClim d = a ) = 1 •刖 d 县 a 的 

• ^ ^ m ' I _ I ， 、 r ▼ , ' - ■ ， — ，，丨 - w ~^ 

n=l n 

瞄栩会估卄 

• I b-t |—| lh~» ^ I 9 

(二）矩法 

这是著名英国统计学家 K. Pearson 在 .1894 年提出来的•设 
随机变量X的密度函数(或概率函数)是 fix ， d ) ，其中 0=( 氏，…， 
九）是未知参数.若X 的6阶原点矩 R = £ : P 存在，则V,也是 

A A # - - \ 、纛 /A A、/， -« I I ■ \ . t • \ ^ 

fh ， …， ( J m 的凼奴，记刀琴〆扒 ，…， ( L )、 k = L ， Z ，.“）. 假疋从万桎组 

gi (01 ，…， D = V\ 

• fc gzCOi f ^^ dm )— V 2 


gm (❻1， … ydm )= V m 

f_ 

•①注意，这里 $ 依赖于样本量 n ， 应记为 I . 对任何正整数 K 和 N ， 令， 

= {存在 m>N 使得 | b m -b \>^ 

oo oo 

Ak = 门 Ag ， A = U Ak 

N = 1 K= 1 

QO OO 

易知 —6| = V 0 }CI 九另一方面 AkC = A ； Jc ： U f | L -6|> H , P ( A k )< S)p 

n—oo m=N \ 八 / m = N 

(1^-6|>去)，令 ⑺知 p ( Ak )=0( K >1). 于是 p ( a )= o . 从而 —6| 今 

0)=0. 这就证明了 

^ ( < i \ mb n =0) = i 
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可解出: 


r% _ r /'XT T T \ 

Ui = JiKVi ，…， VJ 

d 2 = fi ( Vi ，…， D 


1 = /航(％，… ， V m )' 

设： Ti ， X 2，•••，：*：„ 是 X 的样本，用样本矩 


mm 


V k =^ 

n rri 


(1.9) 


来估计 T v 、 (是=1，2,… ， ni) ，然后用 

Ok = fk(Vi yV m ) 

来估计 dk(k = 1,2, ••- , m ). 这种估计未知参数的方法叫做矩法 


(这里考虑的是原点矩，某些 W 也可用相应的中心矩 ~= E ( X _ 

irv\k ^ 6 h hkrm / rt 办扣吐、 

普 Vt 甘，^ ； W 口 JiLI j 大 I 以 口: r 从杜， 


矩法的根据是什么呢？很简单，是强大数律.实际上，根据强 

— L- 4 ^ Afrt n / 1 • t> T T 、 i tzn -t=^ r 曰 、+ Ldb, rt-4* rV 

人双伴沖 r Knm v k — v k j — i . 彐饥书定迁块 eh 双卩、 j ，似 

n 

f \ \ /D — Ck \ — 1 

，行 i V mil u k 一 W 一 丄 • 

n 

fill i r 沿 j 2 Vt , 县送 f 倌」 f 古的祐 

l^'J ▲•層 T K fjL 7 ^ 7 ^ i 7 y l I '1|»-L ， ， 4 、卜 ， ^ M -4 

4 

估计. 


>ra 

侍 


易知 Vi = KX = 戶， \’2 = EX 2 = u 2 ~h fi ，于是 

f"=w 

| ff 2 =v 2 — v\ 


/ 1 1 rv \ 

vi . iuy 


PFT f> — 1 „ 4^1 T> — 1 —2 八 dllAt-4 丄 T7 : fn T7 7-U JL /1 1 n\ 

m Vi - / A X t TM v 2 — — / A X| 7J 刀 IJI 口 H V 1 TH V 2 y IVa/KVl- 1W 

n n 


n 


l 1 


n 




x 


i 


n 


n 


n 


a 


n 


?叫4 


Xi 


n 


2 (A — 工 ) 2 


对于正态分布的参数来说，矩估计和最大似然估计是一 
样的，但对于其他很多分布，它们并不一样. 
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例 1.3 设 X 的概率密度函数是 

J '—一 m ' 

r\ 廿/山 

^km 

这里 (9 是未知的正数.设:^ ，…， 1县 X 的样本，不难看出，<9的最 

零 ■ ■■- ^ w ' ， m ▼ ^ ^ f ^ ^ » - w W ■ ， 9 ，▼- ■- -， ▼ 

士 / w 妖壮朴 /9= m«v m —卡面 m =! 妨 a 的拓杜朴3 = 

/ 、 tzy^ ^J\\\ IH ^ I ^ ***^-»^ ^ I • ^ V H-H T ▲皁 C% • hjyv V "V IH ， ■ v 

l^i^n di 

—V' .r, J 并不一烊 _ 

/ J - t'v <V V /I > ■_• 

n j 

All 1 ^1 4 RI TTMM ai *3 rib Itfc 槐市 "TTlrll Qa 木粉且 9/1 /I 、 Rrf 槐 

yj 丄 • -» 口 "j v^s vi Adi mi r»p m • r yj ^^ \ 从 /t ： 。飞 ， h’j r»p 

雨童的实际观测数据(单 位: mm ): 

>- 

* 0 


31.00 

2.82 

3. 98 

4.02 

9. 50 

4. 50 

11.40 

10. 71 

6.31 

4. 95 

5.64 

5. 51 

13.40 

9.72 

6.47 

10. 16 

4. 21- 

11. 60 

4. 75 

6.85 

6. 25 

3.42 

11.80 

0. 80 

3.69 

3. 10 

22. 22 

7.43 

^ nn 

v/ • \y \y 

A Aft 

丄 • KJ 

4.46 

8. 00 

3. 73 

^ An 

• \y v 

fi 90 

\j • w v/ 


0 . 67 


凭经验矢 UiS 这种降雨量数据——般月艮从 F 分布，分布密度为 


f ( sc ; a ，/3) 


0, 


ia^ra/3) 


cT x l a 


x^O 

x 〉0 


撕 /riHT 田 4FT 吐 /fdbi、+ 矣 * tr ~ o 田 Y 主 G 愧雨县.田 a 

M J ^J / U IM y I u fjj. J u /V^AM 「十 ITJ S&. f J 14 1 f^Z f 

工 36 表示上述 36 个数.易知 


9 


T T 一 T^XT 一 n 

V 1 —I^j\ 二 op 

V ,= EX 2 =^ 


靡 + 1) 


Vj =x 


36 


36 


\ 飞 n nr\ 

/ y Xi = ( . L \3 


v 2 


36 


36 


X 飞 o 

Zj ^ 


8b. i)9 




解方程组 
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ia ^= l . 29 

■ ^ ■ — 

十 1)=85. 59 


~ A a -t /% d 

1^ a = £ t . 40 ，p = i , 

以上介绍了最大似然估计法和矩估计法，还有许多其他的估 

、 I _ —r^ / 丄 、I ■、— I nr jtr^ j=^> - =xzr t />-* u i , -* 上 a u / 丄 •、— t nr 上 l >^v* 

rr 汰. 田丁伯 rri 円趔步柙步忤，商安人 ii 』玎 对合 t 共伴 闪趔 的头 
阮傦况制宙烚当的估 卄古法 . W 难定朊丁作的翥萆. ■! 走若从下而 

■■碡 ^ w pr*^ / I —f ^ I p—■ ， _ / ， ， ■ r w ^ ^ ■ r ， - — *一 I I ^ f ■ m ' io^ l^i ，/、 v ft 

的实际例子不难理解这一点. 

伽1 $ 杖朴古达幽命执她田午褚相丁你女笛一外册見+ 

WJ -■•〜 IM ^ I /V 口 A * 八 W / 1 ^ ^ I P 9 —"L— ■ 「 • M- •/ 、 IXL. VI /、 

战期间，盟军曾用一种“序列号”的统计方法估计德国的武器生产， 
结果非常有效.事情是这样 的：德 国的每件装备(无论是 V — 2火 
箭、坦克还是汽车轮胎等）上都刻有一个数字（序列号），表明它按 

汰来壯欠生||选山 3 fel A^t > A ^ 1 ^ -Ut -/r n vftnl -frn 右 ll 甘工木丄 ifcil 扯山祕 

Jkaixr^r- ny tA./r^iihi 3 i i 7 u >h ，： t_j 木八 yv nrjxa 山口 ，j 

马克一 I 坦克共有 N 辆，每辆坦克带有一个号码（从 1至 N 这 N 

人 Mr mr i+t A/t 人、 \T AA 你曰 BB 中 r ； 匕 TT /m l^r AA 士 咏 A 、 4 f 4 二 V+ : £D 

I aexx.'r n'J 一 ’ I 八』、 trjTa 疋 2 i 午汐| liiqx 于； izei 了 u 任 

中，某些号码（序列号）被盟军知道了（由于某些德军坦克被俘获或 

W • — - - W *■ ， — - ™ 一 » 警 ■ V W 

者德军的邮件被截获），例如 t <々 2 < — <々„是盟军获知的 
n ( n ：>2) 个序列号 ，问： 如何估计坦克的总数 iV ? 

W r ^ ■ -W » < 零 ， _ , 丨 P V ' ■ 眾 ^ W 

我们可把这个 iV 看成某个随机向量的概率分布中的参数. 


从1，2,…， JV — l ， iV 这 N 个数中随机地抽取 n 个，共有种结 

' n ， 

果.我们假定各种结果出现的机会均等.出现 ( h ， h ， …， t ) 的概 
率为^ n 究竟比个序列号中的最大者)大多少呢？自 
然想到应该利用…中相邻两个数的间隔来估计 .一 

^ I r ^ ■ ■ 鲁 

押刃、法是用 


wAk n ^ -^ YAk t - k ^- i ) 

n ~ 

类估卄不难着屮 

，_ ▼ I i —■ ， _ — ， 》 攀， I—i P 星 ■! 




= k n + 





(参看 [10]) 




n m 
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可以证明，用估计 iV 是没有系统偏差的.也就是说，虽然是 

__ » ■屋 i b a — ■ ■. h ^ ^ A 

々2 ，•••，々„ 的值有随机性，但是的数学期望恰好是 iV . 


注我们可以证明 


变际卜.对仵何 Z (1< Z <] V — n +1) 右 

, ■■ - ， f I ^ - ' — — — - ， ■ , I ^ 


k)=c:;’h :) -1 


对任何 i ( n ^ i ^ iN )^ 

▼ w * ^ ， - - v ^ 


P ( k n 


=1 1 = 


(:: !)•(：) 


i ^ 

于是 Efe n = y^jPikn 


n 


^/ i \ / N \— 1 

n ^\ n )^ n ) 

暴- ft 

n( N+ })( N r 


1 / \ n / 


n + 


(N+l) 


这里用到了恒等式 


N+l 


yj l )=(^ 

^ \n / \ n-\- 

麝 ■ *« ■ 


( 1 . 12 ) 


n . is ) 


(1. 14) 


(1.15) 


($ 个恒等式利用关系式 ) =(2) 容易证明 〉 . 


/V-rH-l 


Ek ,= 2 


； V(h, 



/ N — t \ / /v \ 
\n-l) \n ) 


^ T —» 1 

1 M \ i 


y—! J / V y 7V7 V —1 

以 -u •(: ：) 


n ~1 


N-l y , N—1 , -, 

(n+dS LU- Scz + dLUK 


«-l 


N—1 . N , 

斜 Os(f) (… 

/ 一 _ _1 Wfr F _ \ 看鬌 f \ w / 

/ = n - 1 k = n -J 


/ KT 


.”(:^仆:) 


N+l 

72+1 
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由此可见， 


n 



n — 1 


Ek 


n 



n 一 1 


Ek i _ 1 


n 2 (N+l) N+l 

in _ l)(7i+l) in 一 1 )(? 2 + 1 ) 


根据这个估计方法，如果有 5 辆坦克被俘获，所带的序列号是 
14,28,92，146,298 JljiV 的估计值是 

284 

w ^ I \^J "XT ^ 

W ! 兆十 = 

4 

第二次世界大战结束后，盟军査阅了德国的官方记录，发现上 

分旦七 ; 且说 I 沾 UU 估 RFI 廿 /lit 佐白： sk 、 M5Xfc 山丄独 Xfe 
xxLrr 7^ ^ j4 版 1 寸 ; ry 口 : nrm 处山 k/ti 六 mss 、 不识 r、i 卜 u_i 口 : rn=m mwn 

得多.例如采用上述序列号方法估计出德国1942年生产坦克3 400 

tec AVX Mr VTI 'ZXI ： 口 Ft OCT -Cj| m t\zrt JMtt* X 一丄 TL -9=h / t L -irt v^Hlil ill 上 A 

網， 1 R 汝虹头邮 1 W (7 L ， 叫避牛不 J / tl | uj 诛衍羽汉兴 imiWtfR 低侧卬的戮 

字县18 000撕，与銮际情况 t 相径轾.出现汶种情况的原闵县许名 

▼ ，_ ■ ， ， ▼ ， r ， ■ ，， ■ W—9 9 ■ ■▼ ■ ■ V - ^ _ • ■ v ^ W 丨 * ▼ ， r ， w P • ， 丨 ■ _ 

情报受纳粹德国的夸大宣传的影响，序列号方法则比较客观. 

郑忠国 （1938 — ）告诉作者，估计量(见 （1.11)) 还可以 
改进，他指出估计量 

w. = b 4 - — (h. — b. , — n “上。、 

，，4 r ^fl I x j v i ，v i —丄 x 9 ^\j v x 

n TT , 

f —丄 

iVt *fr -tH J^f 曰 \r TS? 口 \IT 沾七丧且 #1 、 

卩 y 双于別主疋』、， "u±± ”2 口 yyj 左取 m 、 

不难看出 

W 2 =—^ M -l (1. 16) 

n 

注从 （1. 15) 和 （1. 16) 知 

EW 2 =N (1. 17) 

沣音怂 1 .… 、k 一 部县贿机亦量，它们的槪座分布与 JV 右婪. iV 不同槪 

• _ 1 , P^f • V ^ 〆 • r ■ k i w -# p ，▼ ， f_ ^ 一 - V ^ ^ '^曹 一 - , ■令 

■ J ^ /\ * i I I i ,A»f> JL . ■ y r r t g ■ / - 4 A 、 V - 4 A 、 ^ t - I h 山 f \\f_ XLm ■ A#JU r~t I_^ 、 v * - 、人 Liltf ■ *- 、、, 

半甘作 m ® [艾 j • 囚 imu . iz ) fiui . l /) 干的奴字朋里付亏勻 n 句天，广格祝 

应用 E n 代替 £. (1. 12) 和 （1. 17) 的准确含 义是: 对一切，等号成立. 

我们可用初等方法直接证明下列重要结 论:设 批 k ” …， k n ) 是 N 的任何 
估计，只要满足 E ^ ik , ，…， 0 = iV (对一切 iV > n ), 就一定成立 
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E N ( i p ( k l 9 - J k n )- N ) 2 ^ E N ( W 2 - N ) 2 

_ 广 _ ■—t v t # v * « v t vw 一 ■ v ^ ^ A V - I - M • 1 11 ■ t ■ _ M ^ 1 11 ■ 

mB.m pu 〗 ， … ， 々 „) 年 w 2 时 u. is) 干左厢 x 卞石厢 . 

证明稍长.不妨设 （ i . 18) 中左端有限.令 

〜 d 

ip ( l ) = E N ( ip ( k ' ，…， kn ) \ k n = L ) 

= 2 ipiil ，…， DPikfU ，…， k n = i n \ k n 


(1. 18) 




H ipdi ，•••“”) 


l — 


*1 


则 E N ( ip — N ) 2 = EN ( ip ~( p ( k n )~\-( p ( k n ) — N ) 2 


E N ( tp -^( k n )) z + E N (^( k n ) - N ) 


~TLiL N K ip— ipKiZ n ) )KipKR n ) — 1^ ) 


M ■ ■ ■ 1 % 

vi. 丄 y/ 


我们指出 


• 0(^„) = En ( ipik n )) 


i ^ 

实际上 ， Ew }( k n )= ^ P ( k n = l ) E N (^( k n ) \k 


n 


* ^ 

2 >(t 


n 


n 


DipiOEjsi(ip I k n 


§ ^ 

及⑺ m n = /)0(/) = E N a ^( k n )) 


n 


i 'W 

另一方面， E / V 0 ( k n ) = y^.Pjkn = /)0(/) 


n 


t ■W 

y^jP(k n = DE N (ip(ki ,••• f k n ) I k n 


n 


= E N ( p ( k x ，…， k n 、= N 

干县门 . i ? n 由右端笛二顶县 o 下而楛屮 

, ■ 、_， 一好， | t— | ^ __ 兮 ， | ▼ _ /、，■ w • 9 ft -# f-« ■ ■ f 


ib ( k ^) = W ^ 

■^r- ， w • w 

实际上，因为 f ：； v ( i () U — W 2 ) = iV — iV =0( 对一切 iV > n )， 即 


( 1 . 20 ) 


N _ 

v 「： 

/ J T" 


m 


- 1、 Ipi 


Cl . 21) 


由于 P ( t = z )>0( — 切 Z = n，n + 1， …， AO •令 iV = n，n +1, …从 （h 21) 知 

0(/)=^^_1(/=72,72+1广.，~).故（1. 20) 成立. 

n 




利用 （1.19) 和 （1.20) 知 
26 • 



E N (< p - N ) 2 = E n iip-WzY + E n ( W 2 - N ) 2 

^ 、 - n 、 i l—I - 1 t — L ' T '^ ✓ • i t \ 9 、 ' T '^ y Ttr \ 1 、 1 

gui . 丄8>1 成 ip^yvz nr ^N^ip— ^\r ^- t / v ^ vv 2 — . 

换句话说, W 2 是所有“无偏估计”(见下一节的定义 2.1) 中方差最 小的. 

i 

上述序列号方法的合理性（见 （1.12) 和 （1, 17)) 的证明中，我们假设行是 

* I 

在 随机的，因此才有 （1. 13) 和 （1. 14) 成立.有人可能认为这个假设不太合 

理: 战争中被俘获(或击毁，下同5的敌军坦克数目应是随机的.因此另一种 

^ * 

1=1 -LL. x t u-t>fi=r 4ac -W* M r*4^. JLi. 4nr sixt 、 f/ x r In -f^. A*" I~L 丄 丄 M Hrr 丄 

ir 议定，六仴 a wsffi 兄，母網依〗子状 trjm 平刀 />• 彐以邳 p 不沖叫 fnuvi m 

4据 l < h < h<*“<KiV 来估计 N ? 

用 r 表示被俘获的坦克数目， r 是一个随机变量， r = n 则表示 N 辆中恰 
俘获 n 辆.易知，当 1 <A <£ 2 时 

/ N\~ l 

P ( k \ = i \ ，… ik n = i n I r = n )=() 

(N — i \ / N\~ l 

于是 P ( k x = i \ z = n )= [ ) [ ) ( i = l ，2 f ”， iV — n +1) 

\ n-l / \n / 

/ i~l \ / N\~ l 

P { k n = i \ z = n ) = ( )( ) (i = n ， …， N ) 

\ n — 1 / \n / 

从而，和 （1. 13),(1. 17),(1- 18) 类似，有 

E N ( W l \ r = n ) = N (一切 N ^ n ) 

E N ( W 2 \ T = n ) = N (一切 N > n ) 

而且若 0(^ i ，…，是 r ) 满足 E N ( ip(ki ，…， D 丨 r = n ) = N ( —切 N ^ n ) ，则必有 

* 

/ / * / 1 » 、 TV T\ 2 I \ / /TTr X T\ 2 I \ 

r. N KKipKfZi ,••• ^ T ) — iy)' \ T=nj^r. N KKw 2 — ^厂 \ v^n). 

换句话说，即使把被俘获的坦克数目 r 看成随机变量，则在 r = n 的条件 
下，和 W 2 都是 JV 的“条件无偏估计”而且 W 2 还是条件方差最小的“条件 
无偏估计”. 

以上再一次说明了序列号方法(用或 W 2 ) 是有道理的. 

8 9 . 仕仕的梭电 株麻准 

O ™ Ilf r I w »•** K'# w 

同一+ 主如余 粉的壮斗鲁右俎名轴，目 n 估县估田甚士 / w 钬壮 

n | ， i 、mv im y 1 J = f ^ rj r \ 1 y / i-j ih 

计,样本量不一样，估计量也不相同.什么样的估计量最好呢？这 
就涉及估计量的优良性标准.从直观上看，自然是估计量与被估 

计的量越接近越好.但“接近”二字的含义不很简单，有深入研究 
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的必要. 


设 X 的密度函数为 / U ，0) ，其中 


，九）€0，0是尺 


中的非空集合.设 〆 的是沒的菡数 ，又， X 2 ，… ，尤是 X 的 样本. 
所谓以 (9) 的估计量，是指样本的函数 〆 不，…， XJ . p 的不同选 


g \0) [ 越小， 


4*^^aini-jr ra 古 u 丢 I v •“ v \ - 

i 干肌 i 寸 m 、 門卩 y I 口 m 里 . 丑肌 丄句， I 少 v 八 1 ， —— ，八 " 

< p 就 越好. 但是 < p ( Xi ，… ， x „) 的 { ji 是依鱗于样本值的，它本身是 

随机变量，而 〆 仍是未知的.所以评价估计量的优劣不很简单，需 

、 

専衡量优自件的标准.当姨汶神杬准不县睢一的，从不同角度出 

w - - ■ » - 丨 ▼ w ~~~ * ~， ， ■ ▼翬， ， ■ W W ^ W w ， W ^ ■— - 

发可提岀不同的标准. 


由于样本^ ，…， 又的联合密度函数（或概率函数）与沒有 

V # •貧 / •擎 響■、丨 ‘ * * “ — 獻 - ^ # • - ^ - • V - 、 • ，音 V V ^ V 

天，故 < p ^ x , ，…， D 的期望与0有天，有时记为 E e 9 VA \， …， A n ). 

史(兄，…， X rt ) 的方差记为 Vs ^ pU ^ ，…， x „\ 

定义 2 . 1称以兄，…， X „) 是 g (0) 的无偏估计，若 


f ^ T ^ T 乂 / 八乂 ' Irrt r\ 

，…， Ad= 茗八一切 U^zlSf) 


\V ^ ， -JZU _ / V … V \ 0 / n\ ^th IA- 4 丄办 A/f / 一、一 

ac 入 a . ^ k>c 9 、八 i ， ”■ ，八 n 乂 疋名、卩/ 卩; n 口 h ， iyx e v (pj — 

E , l < p { X x ，…， XJ — &(们 1 2 为 ® 的均方 误差. 

— I - - 丫 — - § ，- ----. — 

C=f ±J-» 、a -ve* + 0 ^ . 1 . /LU 、 I T*-l\ 4 sl>. Xr^ \t^ 1=1 ~r* /-U > I. rt-L /./« 

亚热，巧刀跃发越小，伯 TT 桃趙奸 • 3 p 定兀湖怕 TTB、jtTJ 

均方误差就亦为 m 的方罢 T . 

▼ ， ▼ • •，， W 〆 _， ▼ ▼ ， ▼ / ， ▼ 

定义 2.3 若妁（兄，… ，尤） 和咚（尤，…，； Q 都是发 (60 的估 
计量，且 M / pXM〆 朽 ）（ 一切 i 960)，则称 p 不次于矜，此时若 
还有19。使得 M tf 。（妁）<]^。（灼），则称妁比灼有效. 

例如 gid ) = E e X 时，兄》 =丄令足是 的无偏估计日 

< ，，_ ， ' ▼ , - \j — — ，-， f 一 一，‘ / J — — t / €—1 '免, V 9 ■ ▼ ■ ■ _ 

、 71 1 

1L JT r 'XT 、 T T ✓ ，尸 \ 1 T T 尸、 1 * -^Mk* t^S > V • TXZT r-\ /TT ✓、尸 \ 

ivi e KA n ) = var ^ A „; = — var ^ A ；. 小难有 ffi ，只安 u <^ var ^ A ；<^ 

n 

n n 

oo . lilll ^ Y 7 . 右嫌 V *n X 1 2 . = 1 时 ， 〜 = — Y 与,〜 = 

y >/vj ▲ 暴 n— I n ? =| / j /\ t 丄 mj 中 i / j ^ ^ t 十乙 

1 n 1 


都是由样本得到的 EJ 的无偏估计，且妁不次 于灼 . 若 

A :，. ♦•丄不全相等，则灼 比矜 有效. 
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因为均方误差是 0 的函数，两个估计量并不一定总能比较优 


劣.在绝大多数情况下，不可能有不次于所有估计量的估计量*即 

，厂 刀抓 ; s: 取， j ， wv I 口 m 里 * sHu^wn \i4 y\ wv vu pc r 工 i/j 、tpi 

时，往往不得不缩小范围，例如在所有无偏估计中找方差最小的. 

?rL 'Xr tjt PT 'xr 丄仏 一 i- —r* vJx -rtn AA. ■ I ■ -V^ T 7 / ^r\ AA 

议 A! ， … ，定 a 的忏平， r 边疋理范 m J 刀左 var^vA^trj 


一个子偏估计 


r^i -rai , ，rL XX* —)u^ t t / ', 、 -afc^ -/r* C^\ 

疋理厶 i 议 a tfj 刀爱 var 八 av 什住， o 


d 


n 


n 


✓ TJr 

乙 va 2 


n 


-r 、 0 i 、- 1* rTt "T 7" 

Ar [ 达里 a 


丄 q 灯 \ 

n ^) 


frrthl 广 、 9 *w* ▼ / t y v v * / frAj / I ^ \ I rtrt 

，则 y 定 VarAA ;^ xmT 5 TTJfJ 

E , S 2 = Var ,( X ) 


证明 


rm rm 

\^rv - y ^ = V v 2 

/ J 八， X1 ^i 


n 


r v ^ 2 


于是 


n 


t^ 2 丄 V ^ -xr ?. W t^ / tt 、 


r* ■ ■ w ， o j- v ，、 o 

— l^a ^ — h / Ar 」 


n —— 1 


n 


^-[ Var ,( X ) + ( E e X ) 2 - Var ,( X ) - ( E , X ) 2 ] 




n 


n 


TT 严乂 - Li*T ✓，严 乂 

Var ^ A ；— — var ^ A ； 

n 


▼ 〆 


Var ^ CA ； 


iJfm 

_ I 


从强大数律知， S 2 是 Var / X ) 的强相合估计. 

定义 2.4 设/不，…， X „) 是 g (仍的无 偏估计 ，且对一切无 
偏估计 ibCX '， …， XJ 均有 MAwXMAib ) (一 切仍，则称 ( D 备 “0) 

， • - ▼ •丨 • ，- A r v ▼，▼ ^ ^ ， V_,_ - ■，- ▼ 丨， M ^ 

的（一致)最小方差无偏估计. 

“最小方差无偏估计”就是一种最优的估计量，它在很多情况 
下确实存在，当然也有不存在的时候.有时无偏性标准显得不合 
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理(参看后面的例子）.还有别的优良性标准，如贝叶斯标准， 
minimax 标准等等，这里不介绍了（参看第七章). 

任沮本 II / ^^热、旦，1、士电车他奸 44* hr o 分 ] r 且由& 1W1 宙室 

^s*、m 寸 ； pmv — 从 / 取 M 、 力 ： syu 调 | 口 h : 必， 1 、疋廿勿 口 : ；乎 ， rm 

要具体问题具体分析，没有一个普遍适用的公式.但在20世纪50 

/rr /JxznZ AA ni — _i_11 t i o i_ f r -rtn >人 rt-l* -r^ ^ 丄 ->-* 

十 1 乂 trj oiacKwen - Lenmann — ocnene 牲 Tts、vj 丁寸小取勹、刀 

差无偏估计有重要的指导作用，汶个理论的严密论沐渉及测度论 

-^― — - w w ■ w w w • ，▼ _ ■ ■ _■ ， w - ▼ ▼ ^ | | f ^ ， w 冒 -^ ■-^ ▼ 

等较深的数学工具，这里只从方法的角度作一粗浅介绍.为此先 

介绍右广荇 甫恶音 V 的槲今—— 

/■ ， 》-f ■ -4 / 孱一 I 7 U 


——奋斗铱彳+暑 f 

/ U* /V r I • 

定义 2.5 设 Xh …，; c 是来自总体 F ( x ;(9) 的简单随机样本 


(冗0)，称1/= 〆 ^，…， X „)( p 可以是向量值的函数)是0的充分统 
计量，若兄，…， X 的联合密度函数(或概率函数) LU ，…，心 ; d ) 有 
分解式： 


L ( xi ，…，: c " ;沒)= q \^( pixi ，•••，:*:„) , d ^\ h ( xi ，"•，•!：„) (2. 1) 

(一切(960)，其中 Zi ( •) 是不依赖于0的非负函数® 

>- ▲ # \ * \ . v » _ » * — k_*. . v ^ ^ 、 _ r M^b 丨 一 ^ ^ 丨丨， w W » 丨 # 

允分统计量的蒽义 在于： 它概括/样不 A ，…，甲天卞£/的 

全部信息.所以在估计 g (们时，仅利用充分统计量即可，而不必再 
考虑 ( x ! ，… , x n ). 例如，若 工1 ，…， 《 r „ 是两点分布 B (1 ，/>)的简单 

随机样本，则易知1/ = t ^是0的充分统计量.估计时，只需知 

1 

道《次试验中的成功次数即已足够，而不必再关心具体的哪次成 
功（: C , = 1) 哪次失败 (A = 0). 从 (2. 1) 看出4的最大似然估计如 
果存在，则最大似然估计一定是充分统计量的函数. 


①可以证明，充分统计量有下列明确的概率意 义：对 任何随机事件{(&，•••， 
及 “0，条件概率 pccXl -， x")e a | < pdXi ，…， x ”）= Ko ) 与沒无关. 

实际卜 . 有事强的结论，为了 LT=r«fXi .…. 兄 • ） 县奋分统计音.必须曰只须卜沭条 

，，罗 r w ^ r"* ^ ― w m ^ ^ — 、 _ 一 i ， ， _ 一，•尸 / 〆 ▼ -〆 mm » p ^ ^ ■零 ， ，，^ ■ v w ，，， 

件概率与 (9 无关.这就是有名的 Fisher-Neyman 因子分解定理.在一般书上把上述条 

/il^ -tnar l a _ A - * t 、 r km j 毚 - _ i ■ •、* 、 ■、- -Jw*_ 丄 l , x_rv Jkr^ / «t. Jjf i y r — 乂 ri A ^ _ AA l ■會 

汁 惝半勺 t/ 兀天忭刀％足尤甘犹 rr 重的疋乂 . 安汪葸的走，上还汆忏 m 半小很间毕，囚 

为在很多情形 下“ 〆 兄，…， x „) = WQ ” 是一个零概率事件，不用测度论工具无法处理 • 
充分统计量的直观意 义是： 它概括了样本（不，…， x „) 提供的信息. 
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从上述充分统计量的定义容易寻求充分统计量. 

例 2.1 指数分布. 

咖由怎备曰 
瓜戊田双疋 

/(x,A) = /(o.oo) ( x ) Xe~ Xx ,A G (0,oo) 

其中 i E U ) 是渠台 E 的 7 K 性 函数. 

rll ^ Dr +-1^ -Jr / V … V 、从併人由由； 3； «#r 瓜 
iHi 口 、 J T 十干 、八1 ，…， A„y 口 y 职 口 贝 戊幽 双 yv 

n n n 

II / te ， 久 ） = I I I ( 0, oo ) ( A ) • X n e~ x ^ x i 

-a. -a. _ - .■- 夏 

l i 

n 

与 （ 2 .1) 式对比知，，…， X „) = 刃足是 A 的充分统计量 • 

1 

例 2. 2正态分布. 

• • _ Ja* - \itt - j~> 

钳皮凼奴定 

/(j：;/i^) = -7^—exp(— — fi ) 2 ) 

s/2iz8 ( 如 ) 

其中 "€ ( — 00 ，°°)， u € (0，°°). 

此时 样本兄 ，…，兄*的联合密度函数是 

▼ ■ ， W • r W •■ • W _ , ■ — ~W -^w ， ■— ^ 

J [ f ( x rf ^ d )= (7=) exp|— 

i v u iti/ \ 一 v i / 


/ 1 \ w 

exp 


n 


2^ L^ Ui 


i - x ) 



q « n 

其中1=士2>“ 可见， 〆 兄，."，足）=(又，2(兄一叉) 2 )是("， 

n 1 ，1 

n n 

K 

#_ 、 * p t * t 一 \ v I t I . 曾 _ I ▲—— / i -w v i ， ^-o \ . t . t-i j ， 》 、 費 # _ _# % 詹 、- 

d 、) 的允分犹 rr 重. 冋埋刘， (, 2 j a , , 2 u x ^ j 也是 k ， 幻的允分统 

1 1 

计量 • 

例 2. 3指数型分布. 

〆 

密度函数(或概率函数)是 
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f ( xfd ) = S ( d ) h ( x ) exp { y ^ J C k ( d ) T k ( x ) 


k 


其中 e = A ，…， ej 6 0 ，Si 阶 > Q ，0是 m 维欧氏空间中 
的 开集. ， 

许多常见的分布如指数分布、二项分布、 Poisson 分布、正态 

• -w w r 零 - ^ 暑 , ^ w ■— ^ ^ w ~~- ■ 

分布等都是指数型分布(请读者自己验证). 

此时样本(不，…, X „) 的联合密度函数(或概率函数)为 


I I rr n\ r r» / n\ ~ln I I j / \ _ f \ ^ / n\ X 飞 nr / _ 、 1 

丄丄 ， C 7 V = LCHt 7，」 丄丄 Al 、 uexjj ( / ji^kKOJ 2 u 1 kKJCiJ i 

1 l =1 奋 =1 1=1 

M 

n ，泰 

可见， — X "…， 又）=(2乃（足），“.，2了“足））是0的充分统 
计量. 1 

例 2.4 均匀分布（不属干指数铟分布！） . 

— 冒 P V ，严 ▼ ^ ▼ , — - 

密度函数为 


/(: c ; a ，6) = J [a , 6] (: c ) 


b — a 


这时，样本(不，…，又）的联合密度函数为 

n - n n 


(忐) 


[ a , 




x z ) J ( 


， o 」 


(mp y 

V 篇島 


X 


可见 〆 X 


, x „) 


11 丄 111 


i ， max 足）是(^，6)的充分统计量. 


充分统计量概括了样本中所含未知参数的信息.充分统计量 
不止一个，例如样本本身（兄，…， X „) 就是未知参数的一个充分统 
计量(这从 (2. 1) 直接看出）.什么样的充分统计量最有价值呢? 
显然，充分统计量，…， X „) ，…，妁（兄，…， X „)) 的维数 

I 絨小就絨有价倌，闵为我们用尽可能少的量概括了榉本中椹供 

，響 / ■ P ■— ' • ■ ， ▼ -»■ ^ fW-^f I ^ ^ 『， ▼ _ ■ 、 ■ ， — ， 9 V 99 ■ w ， 

的信息.例如设样本值 A ，…，: r „ 来自正态分布，我们可用两个量 


n 


王，含? U 来概括”个原始数据提供的 信息. 以上的几个 
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例子里都存在降维（即维数小于样本量）的充分统计量；而且不管 

to 金 _ — A te. ^ ft - ■ 里 a. k •_ ^h ^k. 

样本量多么大，氷远有维数与未知参数个数相等的充分统计量，这 

本彼且 AX 亩 1 

口 ^ /t >4 〒• - 

但要注意的是，并不是任何分布族永远有降维的充分统计量. 

加士 rt 龙 々 /A/t 士士〜八士 廿咖 FteZ 央 /r 瓜 

ir_j>w 百泊口 ” 卞叩 / 』、万叩，开江双乂 / 

1 

f ( x ； m 9 y ) = I (0 , oo )( jo ) if Tri • mr 7 ^ 1 expl — (― )) 


] / 
n 

^ f 


Cm>0,^>0). QJ 以址明，当 n^6 时仕何统计量 <p=(^H ， …， 

又），…，外（兄，…，足 ）), U < W ) 都不是 ( m ， 7 ) 的充分统计量. 

4 

*. — ■ — - - _____ _ _ 

还有一个重要概念是所谓芫全性.称统计量，…， X 。）是 

白 A 66 ^ti^jf^jtm HT 、 )fflil 、 函 *(r ，，广 • 、 口亜 CV，， 「…， Y ••• 

夕 U W^ 9 >1=1 /VJ I 丄 irj V -J 17；^ / TO y^K ^ \ / ^ / 、 ： 5«r l ^ v i ^ ， 

X n )] = 0( 对一^切 0) 就可推出 P <?( mC ^ pCXx ，…， X n )] = 0) = 1(对一 k 

W 

》 T7 Z )、 2 士 ffi D 甲 - hr 3Kfr Q -tfl Hh -ifla! IT 甲 tr D 士口 rJv Aft 3fcfr 

KfJ • d i 沒 7£—j ^xx. i/ m ， m、j ， ^e te —j ! 沒 1 口 /i!L 口 y : SAf 

期望. 


可以证明，前面几个例子中给出的充分统计量都是完全的.例 
如，若兄，…， X „ 是两点分布 B ( l ，/>) 的简单随机样本，则 <p = 

M 

v 且由么 iVt u m ^ m n 一 tts zv-Ar e? 人、 

/ j te 兀土口 y* 大 m 、 丄，四 yy p mLjy\ — ^ 火刀 ih u\n^y ； ， a-j |工 imj 幽 

l 

n 

数 w ( •) ，如果 E p u (< p )= 0( —切 /> 6 (0，1))，则公 u ( k ) C k n p k (1 — 

h = 0 

rw v 

p)^ k =0( —切 Z >6 (0，1)). 令 3； = />/(1'/0,则对任何 3； 6(0, 


n 

oo ) 有 =0. 但此式等号左端是义的多项式（次数不超 
*=0 

过 w ) ，故必有 m ( A ) = 00 = 0 , 1 ，… ， w ). 即 9 ?是完全的. 

■prr IW 4 X RR n hh ^ /Oi rh Jfcr Zi . Tfc-fcfc rft iVt^r 

M 4 kA wl ^ ，右 ^xx. i/ 口 y 禾 口 cy m M 日 xx 生 yj 叩狀丁口 y 儿 


n n 

分统计量 ? = (2 uT \ (^), …， , 2 ] TmU ：)) 是完全 的. 

1 1 

下面不加证明地叙述 Blackwell - Lehmann - Sheffe 定理•它 

的证明涉及较深的数学工具，需要条件期望等概念. " 

Blackwell - Lehmann - Sheffe 定理:若 < p ( Xi ，…， X „) 是完全的 
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充分统计量， 0[?(足 ，…， x )] 是以 刃的无偏估计，则，…, 
x„)] 就是〆!?)的最小方差无偏估计. 

泊 I FRi 士人 tiriffiTrr fW ^{ 旦右 II 々斤 夕古共 vV 6h4r± m /ftl 去口 々 rf TT ： 太:乂 
T'J/rg I I7U y\'j Jt^ m ^ 

NC^，〆） 而言，样本均值 X 是#的最小方差无偏估计，样本方差 
S 2 = -^1](足一X) 2 是 CT 2 的最小方差无偏估计.在可靠性工 

71 — \ ~ 

丄 

* 

程实践中有下列问题:设X〜 AK^tr 2 )^，〆 未知，如何根据样本 

僧 … .T 姊 m 挪隶 P f M 的易爪卡*装子偏仕朴？ 1 怒付 

mu. 丄 7 ， *-m i*ru I^ 丄 ^ / mv r 4 ' >cn /u im r § • 

Kolmogorov 的深刻研究 （1950)， 得到 P(X>c) 的最小方差无偏估 

( 

计 ip(xi , ••• ，: T„) 如下： 

*oo 

( p(xi , ••• 9 x n )= p ( u ) du ( n ^> Z ) 

w a 

-t-U ± _|L^ 

共甲 



B(p^q) = x 广 1 (1 一 x)^ 1 dx 

JO 

对于两总体 情形： ,^), y - N (^ 2 ) 且 X 与 Y 独 

—^ 上 m irrt /-U >1- T'fc/T^T 、 X,、 rt 、- U 1=4 —r- -frt /^4 - 4*/~» ITT LfK T*Tr wM* 夂口 *HT? AA f、：Tt 

兑，夂 UlRJIttTT ； Y 达定丄住辑 ㈣ Kl 菲 1 土 W 九 1 T1R 里安卯 PJ 

M . 份 X 的榉水县.… . H 的榉本甚 K .… . Y _, 缉 n = m 时 

f 酽 ▼ - ^ P P | W ^ 一 , ，‘,— 『■•，,, , ，， r — 丄, , 一 "• , — 1 ， 

Xi — Yi ，…， X „— Y „ 是叉一 Y 的样本，可用上面介绍的公式来估 
计 PCX — Y >0)( 即 P ( X > Y )) ; 当 时，如何找出 P ( X > Y ) 

的最小方差无偏估计？这方面也有估计公式，是20世纪70年代 
初得到的.公式较繁，从略. 

关于无偏估计，我们指出它有时不存在. 
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例 2 . 5 设 X 服从二项分布 B ( w ， 0 ) ( 0 < 0 < 1 )，即 


P ( X = k ) 





6 k (1 一 0 )^ (是= 0，1，…， n ) 


-1 


我们指出 g ( d ) 


1+妒 


没有无偏估计. 


实际上，若 MX ) 是 g (仍的无偏估计（现在样本量等于 1 )，则 


n 


Eeg ( X ) 三 g ( d ) (—切 0 ). 于是 扪 


n — k 


0 


+ d 2 


(0<沒 


< 1 ). 此式左端是彡的多项式，而右端却不是，不可能在 [ 0 ， 1 ] 上恒 
等.这个矛盾表明 gi &) 没有无偏估计. 

我们强调指出，不要把无偏性要求看得过分重要.无偏性是 
大量重复使用同一估计量时应该尽量满足的要求，根据现有数据 

讲行一次件估计不必要龙 什么无 偏#.有时无偏件的要龙会导敔 

^ _ ■ > p ■ i 一 ^ P f -— ，， f ■ ■ - _ ， - ， ， W 9 9 ^ I m » ^ - ^ ，聲 

很不合理的结果. 

例 2. 6 设 X 服从 Poisson 分布，艮 P 


P(X = k ) = —6^ e~ e {k = 0 ， 1 ，…，沒〉 0 ) 

是！ 

口 + 二白 丄 _//!、 - -2 d Jrt t / V 、曰 _//!、工 / 由从 _> 丄/提士 且故工 

㈡ 叨、疋 1 口 H g V(77 — e • KSC 茗 VAV 疋名 V(7Vtrj>oy _'| 口 H V 汗平里守丁 


1 )，则 


VJ 

务 = 0 


g ( k ) ^ e - 6 = e 


2 d 


(d 6 (0,oo)) 


-r* B 

丁定 


TjgCk) ^ = Ta-iY ^ (d>0) 

― Kl ITT ； Rl 


k = 0 


从而 = ( —1)^(^ = 0 

v ■ - - -w r ~~y ' ， ， ， 、 


• # • 


). 汶就县说， g (/9) 的无偏估计 R 有 

零 醫 ， f r ~3 、胃, w ▼ -v ^ w ■,， f p ~ p 『 w ， ， v ^ 


个： 当观测值是偶数时用 1 估计厂 2 %当观测值是奇数时用 一 1 


估 i + 

ll-H ^ I 



「 le _ 汶个估讦暑®妖县不会裡的.田乇县仕讦 

， • I | #-H r / ^ -ir • V y>C-- I |—I f~* V 7 |=~A y V V7 豸 I H ，扉 

总 ( X ) 有很大概率威值 一 1 . 

对于无偏估计来说，当然是方差越小越好.可是当样本量一 
定时，估计量的方差不能任意小，而是有下列著名的下界不等式. 
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定理 2. 2( Cramer-Rao 不等式）设 X 的密度函数是 / UJ ) ， 
这里0是参数 J 6( a ,6)( — oo < a <6< m ). 兄，… ，足是 X 的样 
本，0 ( Xi ，…， X n ) 是发 (0) 的一 '个无 偏估计，且满足下列正则性 
条件: 

(1) ^^{々/(^，的^^与^无关. 

(2) 〆 （仍和 都存在且对一切沒有 



( 2 . 2 ) 


J —OO J — oo QC/ ' 


T#-f \ -•- / V 


(2.3) 


J J1 

aaj -< 


• • • 


j -« 


0(^) I fUi^d)dx 


Tt 


= … 0(^> 芫 J!/( 々， 们 d 乏 

J —oo J —oo QC7 j 

(这里及下面恒记是 = (工 1 ，… ，工 „) , dx = dxi … dr „). 

m 7 Y /9 、=L I I dj n Y 

V ^ ^ a v V ^ y d 沒 J J V 

Irltl 古 —C 7；il 4dr ■: 八 
I ' 7 9 4^ V^G : 


T 7 _ / . / TT XT \ \ ^ 

var ^0 v^\i ^ •••, 


IVW 1 

nl ( d ) 


(2.4) 


， *' I i 

oj 


x.\ ^ #*.a- / ▲ 、 ft > ■鑫 # % i __ 蠱 k t a ^. 貪 - ^ - / 、 、 ^ - 

址明：汪葸汆忏 U ) 表本枳分号与僦苘号 Rj 又怏仄序（汪葸 


w oo 厂 oo •• 

… TT ,/9 )drEl , rz >： l ). 

J — OO J — oo 1 〜 

劣 T ( f)^=oo Y , ..... Y ^= ooR ^ r ?_ FH S 献 F # 古 

— I ■ 、 v ， r k-i ， ^* 皿丄 7 7 ▲ i n ，， _ut* 7\w 9 t * • 

以下不妨设 1(0) < 00 且 V SLT e ( ip) < OO. 由无偏性知 g (0)= 

% 广， ft 

… ipix ) Y \ f{xi ,6) dx ，从条件 (2. 4) 知 

J E J E 〜 i 〜 
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ipix ) ~^{ exp 「^ In /( X : ，没 ) Udr 




UC7 ' 


f 








n 


a 


： 0 (x>n/U^)- S^ln/U^)>dx 


— - /t rfit . AA ( 2 3 

/ W M*l 7 // V V — • v ， / 






■ l r / n\ \ ^ d f i r/ n\ 'i J r\ 

丄丄 / 、工 £ ， £7 "人 ^xinjKXi ,ajjax =u 


• ^dd 


MMB * > > 

t 是 


£ f ( d ) 






E 


V 




n 


d 


f ibCx ) _ 釔(汐 )1 - v ^{ In f{xi ^) } 

e 〜 . i af 7 


« 


JJ /(， i ，汐) d:r 


为 1 田 WQ T7 

,i，J / I^J 矗 tT 以 a « , j ， - 、 J- 


/ rk\ ™l 9 / 


v 






f 


n 


厂， / nx ~l 9. I I r / rk\ 1 

L 屮 一 1 丄 jawar 


%/ 




i% 


E 


V 


n 


XI ^[ln /(j： t ,(?)] j JJ/(a： z ,(9)dx 


n 




n 


Var ,(0) - E ^ yiY .) 


2 


( 2 . 6 ) 


其中 


Y ； = h ( X ,) , / i ( jc ) = ^ z「ln f ( x ， d 、] 

. d 『 … … 

从 (2. 2) 知&1 = 0,从条件 （3) 知&刃=1(们，又1，."，八 


相互独立，故 = nl ( d ) . 从 （2. 6) 直接推知 （2. 5) 成立. 

丄 

证毕. 

不箠式 （2. 5) 就县荖么的 C - R 不等式 . 叫做 Fishei •信 

9 ' V ^ 、 _ ^ •，产 W / ' ■ 県 _ _ — ， 》 ^ - — 、冒, , — 一— f 

息量.对于离散型随机变量也有类似的不等式，只不过在推导过 
程中要用求和号代替积分号. 


达到不等式 （2. 5) 石鞴卜界的尤偏佰计最引人重视，在一些较 
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早的书刊中称之为有效估计.显然，如果它存在 ，一 般就是最小方 
差无偏估计.但是它不一定存在.换句话说， C - R 不等式给出的 
下界有时过小. 


例 2.7 设 X 〜 iVC / i ， 〆 ），/ 已知，卢 未知. 义，…，又是样 


* 

J=r v 从由由瓜 r 


__ 2 \ B Mn 

oojfjL^a / ，勿 

3 ln f ( x 9 g 9 a 2 ) 

. w # 

^ * 


\{x-fi). 


于是 


U sA 


( T 4 J 


a 


x — fi ) 1 f (x i u ^ cj 2 ) dx 


flyff 


a 1 


记又 = 则可见又 

的方差达到了 C - R 不等式给出的下界. 


ITT I \ t 、 - T* rtn -fcf* : r~t A*« trt»r 9 上 A- / 丄 、 I 白 - 1 \ ^ / IT- 、 9 JLX. -X^* 

以 ut 明 ••右 fi 匕沖，则 cr 的怕 rr 星 一 1 — fir mj 力左 

n 1 

达到 U - K 小等式给出的下界. 

Oil r a ^ v bb li 奴 太日 n 

W vr n /J^/^V I 卜 I 刀 U 刀，叩 


P ( X = l ) = l — P(X = 0) = p (0 〈p <C !)• 


此时 X 的概率函数为 


f ( x ^ p ) = p x {\ — p ) 


1 _ X 


(x = 0 fl ). 


易知垚 (ln/(x，/>))=| — 


干县 


/^^) = T 7 T 

一 U〆 j 


x=0 


\ 


_ 1 ，• 

我 in 知退 ， x = - 是 p 的无偏估计，易见 

71 丄 

Var p ( X ) = — Var p ( X ) =— p { \ — p ) = — T y -- 

n n nl { t >) 

-— -— —、 ' 

^ T " 上 、 I _ ， •_> - 3^ rs. ― iUA* tv / A . f ^ H ― ■—* rni-t 

欣 A 的万差还到 J 1_1<小寺瓦钳出的卜芥. 

fill 2. Q Y 日 I ? 从 Pni ci^nn ^4 V 右 T . 目 

J 一 • ， * * MV^ V A I 7 


prv = 

▲ \ z i #v y 




e _A (k 
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其中 A 是未知的正数.我们要估计 ga ) = e ^. 

取 g ( A ) 的无偏估计 

“ 1 \ 
g = V ~^) 1 

(兄，…， 又是样 本).它的方差为 e _ 2 He +- l ). 由前面介绍过的 

T^kll 11 T1 1 ft -*■« 乂 JLt* S .1. —^ -XZ* ~r^_ It^a / 1^ 

uiacKweii - Lenmann - ^cneiie 疋埋，总 宏兀■怕 

x 

W • .A • • • w k Mm. _ rt 、 、 . ^ k k V ^ 、身 

计 . 但 C-K 小等式 : 绾出的卜界为二厂 “ ，它小于 Var A a )， 这说明 

9 ^ 


C 「 R 不等式给出的下界不可能达到. 

在统计学中常常要考察统计量的大样本性质， 即当； 2很大时 
统计量^(兄，…， XJ 的性质.这一点在、§1中已提到过，那里说 

上 丄 i~t 人 Ijt. -Juk 1=1 I . •认 _l* Ijt . rT\ 丄 i " •人 LfL JLi- Art v\/ 丄 《 —■— 

的和甘 彺肌定 A 忤牛彺 M. TO 苜饪的一取疋乂 3 (W「• 

定义 2.6 称估计量％(兄，… ，又 ）U>1) 是 g(<9) 的相合估 


^ 鯽 • > > _ » » ^ 蠱 ^ ‘ # i 

计，若对仕何 e> 0 有 


宙义17 

— r — 

#1 、鲁 麄瓣 ~ 

佰计，吞 


1 1 rm P 广 1 - rr ( f)\ 、> e 、 ―^ H 

aaaaj. J. \ I y/ n ^ W/ ， C / V 

n 

稔估 i+ 骨 ro„ ( X, .… 县^仍的硪相会 

■ | »—■ w I 卞 7i 、 ■ • l 、■ - 一 , o 、 — , I « h^i 


P (\ im ( p n = g ( d))=l 

n 

丧妖.瞄相会估计一宙县相会估 H 不难看，屮.伴何右音 C 的 

• / »、、 ， I « |~| 膠 r-« w § X^v ^ I »"• »—f I P^l 聲 _ ， ■ '»—■ • ■■< ， P—** I ^ ^ 

估计应具有相合性. 

a as + 齡後如 -祐仕 斗一 no •且右 as *h a 处的 

" 、 上 n y\^j^K i-|- />h y im y i ac. n jahi 口 i 丄 • 

最大似然估计在十分广泛的条件下也是有强相合性的，参看 
文献 [2]. 

现在就单参数情形给出一个定理. 

定理 2. 3设 X 有密度函数 /( x ，0)， 其中 je ( a ,6)( — oo < a <6< oo )， 
且满足下列 条件： 

m 对一七 ti 从 n 

、—， ， T 鏵 W v x \ ^ Q 7 


fJi{xi f(x 9 d\ ) 〉 0 且 f(x 9 dl ) ^f(xj 02 ) }〉0 
这里 /i 表示 Lebesgue 测度 . 
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(2) 似然函数 Lix , ，…， = 立/(;，(9)是6的单峰函数，即存在 

1 

6 n =§„( X ” …，工 n ) 使得 L ( X ! ,*•* yX „ id ) 在 ( fl ， 良]上严格增，在[瓦， 6 ) 上严格减. 

则沒的最大似然估计叉（基于样本兄，…， x n ) 存在且唯一，而且久是沒 
的强相合估计. 

证明: 从似然函数的单峰性假定知，最大似然估计良=民（^ ，•…，兄） 存 
在且唯一下面证明它具有强相合性.为了进彳了严密^的讨论，我们假设 Xi . ， 
心，…是概率空间 U ，6)) 上相互独立且同分布的随机变量列， 

V ， J 

这里/2美非空集合（由全体“基本事件”组成） ，蓼是 D 的一些子集（随机事件) 


组成的^7代教，县歹卜右宙义的槪銮 淛麽日 Po ( X . C ^) 

- 一 w ^ , V ， ■ ■■ _ ? ^ / , ^^r r ， ^ »"• ▼ ■ /， ■ m ■ ■■ 一 '一 — ‘ , 


J ： 


» k 


fCu . ff ) du . 

m '■■■■■■< r — -- - ' 


与沒相应的数学期望用^表示. 

任意固 — 氐€ (< 2 ， 6 )•取 s m > 0 ( m = 1 ， 2 ,…）满足 lim$ m = 0 且沒。士占 m 6 


m 


( a ， b )• 刺用不等式 In : r < r ： r — l (： r ^>0 日 I # 1) 及备件 （1) 知 

_ - ■ w — — -^ — — - ■% — — ^ ^ ， _ _ 、 ，罗 - 


I*, 


oo 






Z ) 、1” /(工，沒0 士谷 m ) 4 〜 

j 、丄， i/o /丄 u 77 n~\ ' JUA " ^ v 

J \ X 9 t/o ) 


< E et 


o 


In 


内 y 智方 a I jh. 、 

/CAl yVo Zt 6 m ) 

/ TxT 7 i 9 o )" 


<0 


从强大数律知 


n 


p 


I i : _ 土 


Zj 


L fiXi fdo ±< Jm ) _ T7 « 1 _ /(Xl fdo 士 5 m ) \ 


111 


f ( X i 9 d 0 ) 




A 


f ( x ^ do ) 


丁定仴 



f ，- In L(Xi ，…， X„ ;0 。 ± ) — In L(Xi ，…， ^ 

I ( nm - ^ u 

0 l n 


-1 


n 


故有集合 U ~( A m ) = 0 , 当 0 > eAn 时 ； 

Hm In L(Xi ，…， X n ;do ^ zS m ) ~ In L(Xi ，…， X n ; 0 o ) < 。 


«« 


n 

9 %* 


(注意 Xl , …，； 都是 ⑴ 的函数 ,如6/2). 

—P - S * rj ( - f / “、 Fhf*>£i 

■4 & 口 t — ^ 9tf m vu// " J rj 

t 

L ( X ^ “.Uo 士 d m )< L ( X l ，…， X n ; 0 o ) ( 2 . 7 ) 


令 




I I 


m 


( il OT ，当然 Pe 0 ( A ) = 0 , 对任何 o > G - A ，只要 ri > n m ( a >) ylb 1 ( 2 . 7 ) 成 


_ 
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立 . 利用 L 的单峰性知最大似然 ; 估计么在（艮一軋，氏 + 1 ) 内，有 
dn-do | < 8 m . 先令 再令 m— 00 , 知 iimt = 氐.所以 = 


n 


n 


化 1 = 1 4^ iIF Bfl T ft 的 36S*H 合 +t 

vu ^ ' 47 U -y^ ^ v n H w V-JA ^1 M 1^1 |-X^ • 


证毕 . 


§3 置信区间(区间估计) 


设 


工 1 


,是样本值，前面讲的是用一个量 < p ( x „ 


”） 


(估计量）去估计未知叁教的函数 〆 们.换句话说，用，…， 

■厂1 9 ■ ■ • _ 琴 V r ~， 9 ■_-，，- ， r ， ▼ * • 〆 ， ▼ C . ■: y 、一, ， ▼ V ，~， ^rn r ， _， 、一—丄 ， ， 

A ) 作为 W 们的近似值.读者可能不满意，到底估计值与真值相差 
有多大？这是个很重要的问题，统计学家力图给出回答.这个问 

k ♦ • 私 M M » - ^ ^ - - w * — • —— - W • ▲ • 巋 • k ▲ 

越与估计量作为隨机变量的概率分布有关. 


由 W 1 1 瓜 /n 1 、 ^ r Y … Y \=(n ^ / V …V 、且 

AC , 入 丄 fcX. i V. \V ， _JL/ ， ^1V/X1 ， ，^ %^2 \ 八 1 ， ，八 n ，疋 

两个统计量， 9 ? i < 92 . 称 [ p ，内]是发( 0 )的置信水平是 y 的置信区 

iV^t / - nit rr iVn /4- _>_ L \ -fcH Tt~u _ i*n /1 

i«j ^ i«j id h j 一 yj u 


PicD,(X 
、 / 1 


, X .)< ^CdXcoAX 

,• 【■ J ' - f ^ 


X.)\^y (3. 1) 

F» ^ r w ，一 , 


置信水平也称置信度，常取 7=0. 80,0. 90, 0.95,0.99 •若 


n 1 、才的 : 梢的下施臾 f 对一初 /n 恰你县 ^ rail 餘 v 乇 「,~ . ，〜 1 的 

、 v • * ， v -c-L-^pg »-»v 1 »yM ^ 1 、，，w w v ， 1 i~i 广 4 • 7 kj ， / y v u f 丄 ，十 l _j mv 


置信系数. 


置信区间 [0 ，灼]的好处在于 ：它以 一定把握保证 〆 们在此 
区间中. 


士/。 1 、 •+» A/t 八口 — / /!、 A/t 道 / 士 -T* PFI Ba/^r LITFJ -A* 

狂、 O • 丄 >T TJTJ ， p 2 7 T 力 gvc 7 y ff 、 J 直 1 日 | 、限、且 1 曰丄限.住 

某些问题里只关心宣信下限，此时取灼=〜；在另外一些问题里 


r— » .、人 _、 rm t Wtt H. «-s_L T^- 

只天也 、直佰 J 1 限， W ： 时取 91 = ^°°. 

耳摊朁佶 ( 3 H 苗县一件番萆的丁作 . 劣鈥命撿聃干 m 涉优自的 

，一 i^t. 1 h 『 '* I' ^ I I -~-gr> r-i v —■— I I 7 ——* v 、、、 /-L^* I ^ w ixu r-* v 


置信区间.若不管优良性，取 9?1 = — 00 ,952=^ 00 ，[一 00 , 00 ]永远是 
g •(仍的置信水平为 y 的置信区间.读者一眼看出，这个置信区间 
毫无用处，它没有提供 g (仍的任何信息.什么是优挺的置信区间 
呢？这就涉及优良性的标准.有多种不同的标准， 1 我 fj 在这里暂 


不进行深入的讨论，只是指出 ：优良 的置信区间应该是区间长度 


_ 
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(即比较小（如果只关心置信下限，则这种下限越大越好; 
如采只关心置信上限，则这种上限越小越好）. 

■{糸 本白械么 IVH 斗 r > a * 力女点 vV Q 1 dnr ^ 1、士田且“、” WfT 丈且 

n ^25 ： i m j : yy 11 a i - vo. 丄 / ^ nu ,i 

“= ”？原因是，若要求“ = ”号处处成立，则在许多重要情况下所要 

士 I^t aa /士 G ， vn-JT 六士 IW d >6 r -£ r/el UM 口口、 tV 上 业祕 -4-» rrfr 

小口 y i 谓色 PJ ，|、什 13：. k > W 口 IT!J 丁孤 W 込一於 • 二4价，文力小 

找到置信系数恰为7的置信区间（或置信限）. 

— _ - ■ ■ v • ▼ ― - ，— ■ ^ 'W 賢 •■ »■ p p v r ^ p p ， ■ » 

怎样寻找优良的置信区间呢？这不是容易的事，要具体问题 

县汰分柘_右二个一船株古法可指择我们对旦汰 IHM 讲杆分 拓 1 . 

， 、■届 ，， _<# 參 I - ^ ^ ^4 ， ■< ，， 碡 f I I ， r^m » 内 h ■ v ■ ' 

有助于找出优良的置信区间.本节介绍枢轴量方法和统计量方 
法，第三个方法是借助于假设检验理论的接受域方法，将在第三章 
中叙述. 

±h. 497 -fav 4rft -M* -fcr ^-K 1 去 y^w-fcr 曰 ▲ 士 rt »+r -M> ffi hJh j-h 

曰 儿 ji 扣 m«ffq 里 yj fs ，込 I yj 疋 tvj 寸 5 /t*H 于丁取巾 /Tj 口 y ，必 

是本书叙述的重点. 

Jkl^ ^ -Ui / /1\ AAt / 士 rrr tet : Tt' /M _JrL >4 - 4^ I—* 44A -A- V V 

7 i/J 寸： PCg 、 口夕 WV 且 13 凶 l H J，：PCllj 议？ 2 CJ 2 E 伴 I 汗平 Ai ，…， A „ 

及奴仍有关的函数 A( 兄 ，…， X」H/9)), 俥得抆个函数（实际县随 

▼ ■ _» - - , V ^ W - m W ^ ^ ▲, r ,•, J 、史， ， r 氣 _ 彎 • ， ，^ ^ "» ， , ▼ ， 

机变量）的概率分布函数 HCr) 与0无关.在此基础上找 ；U<A 2 满 

E H (^^ — H ( X,^y 干县 PdCAd 

— — 、 r% 心， — \ ，、丄 ， f m ^ \、丄 ■ 一 \ •美丄 

7. 解不等 SAiS / iCA , 

<pz (jOl 


蠡 

•7 


• • • 


蠡 

7 


• • • 


* * W 7 O ^ r 

; mXA 2 ，得到 9 l (A , ••• , X n )^ M ^ 
• O . 于是[妁 （ 兄 ，…， XJwCX ” …， XJ ] 便是 g (6) 
的置信水平为 y 的置信区间.当然 ， Ai , a 2 还应选得使这个置信区 

r ol Aft J >1 f =3 7 ?r 此 iVf W 、 

l«J py r 、 / 义 /A、”J 日 K 卩 :/ ， J' 

上述的，…， X „ w (<9)) —般称为枢轴量 （ Pivotal )， 它的 

A=fc rhi 八 -h^ I—' -H Pm 分 - ~P- JXU 上 " trrt 4Ji ~rct\ 入 、 AA J4r? -^vU 曰 ‘ -^ll 白 t'm Hil? AA 

很洲 TT 叩刁 不沖麥奴兀大， 3 (U 1 PJ tPCJiJ 百迫 mj 恨彻里肌定 |»J 魈叼大 

键.我们通讨几个县体间颍加以讨论，希望读者从中理解寻求枢 

■» • ， p p ^ ^ ' '^― ■ ^ 1 鬌 _ * ^ f v * - ，擎， ▼ ^ r v ， w • ^^ 

轴量和置信区间的一般步骤.至于所得到的置信区间的优良性， 

咖不去 i 计汾女笛二音由抱会问按柚 丢屮 .过此署信反间县屮紡 

I r w ru • 卜 i^，|V — I 'I’J H 4^% ， F=I 7 IH kU 飞 

优良的，区间是“比较短的 ”. 


(-) 指数分布 

密度函数是 fUM 




(0 ， co) 


(: r ) Ae _; u ，其中 ；1 是未知的正数. 


■ 
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如何从样本 Xi ，…，找出 A 的置信区间? 


从§ 1知 A 的最大似然估计是可以求出的密 


度函数为 


9( 工， A) = /(0,oo) 


( x ) 


(n — 1) ! 


r 广 1 e 


一 Ax 


(读者可用数学归纳法验证). 


n 


人 7 o' ^ mil i AA t±n rrT. 6 

’々 、 Al — LA / j A , 9 MUI fl try HSx J [ S . BH XX . /£, 


p ( x ) 




2 n T ( n ) 

0， 


工 『 !e 卞， x>0 

x^O 

这表明 A 是一个枢轴量，它可用来找 A 的置信区间. 

定义 3.2 称随机变量6服从打个自由度的/分布，若它的密 
度函数是这 样的： 


〔0, 


Pn (X) = ^ 




一 1 -4- 


2 ^ T [^ 


x~ l e 



x ^ S ) 


jn ^>0 

— ^ ~ 


(3.2) 


V 


其中 r ( a ) 

^ ^ W ---- 




t^s 


u ^ l e ~ u du ( a ^> 0 ) 是 r 函数 


o 


V 2 八舍曰从 J 丄此山且姿戒 AAf 八舍 一 V m 、八《口 — AA /V 74- 4^ 

人 7T 叩疋巩 i| 子 1 r 取里女的 7T 叩心一，川 JSISIRJ ，匕们万仪默 

表是一个常用的统计表叭不难看出，上面的枢轴量&正好服从 

2 n 个自由度的％ 2 分布.査本书的附表3可找到 ； U < A 2 满足 

*2 

P (Ai ^ 2 A Xi ^ A2 ) = 7，于是 


✓TN 、 rt m / , 丄 M A ■ ^ t 丄 L / V , A • —^ yW - a Tf-^ / 、 /* A jnJL^ y-v / ^ -fl 、 rt v4*t >■"» ■*"* ✓ 'W r 、 

U ； 议嗯机戈:里 A 的艿仲凼奴定人窀疋议： T P 俩疋 

P^P{X<Xp). 则称 A 为 X ( 或 F ( x )) 的 /> 分 位数. 不难看出， ())•/> 
分位数一定存在，但有时不唯一. 




43 


9 



这表明 


p 


又1 


V 


1 






"Ai A 2 - 

n ’ n 

• 2 y ： x t 2 y ； x i 

1 1 

是 A 的置信区间，置信水平是为了使这个置信区间之长度最 

• L i-V? Afc 1 ' _ ， i=t A. -=T t k t 、 - t* rtD ， 、 i-^ .yffe ri —*rr*l .A. — 

/ j 、，/ 皇仗 a 2 _ Ai 取 ki 以 nt 明 Ai 以 2 m 俩疋 rvj 的 rr 刀枉 


p 2 n ( jo ) dx=y 

」 A i 

p 2 nUl )= p 2 nUz ) 


( Al < A 2 ) 


这里 />2„0) 是 2 W 个自由度的 Z 2 分布的密度函数，即 Pin (^)= 


-1 


l \ n ) 


( x > 0 ). 第一个方稈俣证晋信水平是7,第二个方 


班 k —】_ 4 士 511 县/ 1 \馆 

mz /vi jcji ' j * • 

从这两个方程就可确定岀 ; u 和 a 2 ，但在实际工作中这样做颇 

4dt~ir/^ 1 /.'-t '3 ； tt? m « \ir / v ^4* w nn4%u 、 Xn ^ a 

八 iijjafli 本 m 丁万広，即 tpc ai 仲八 2 涧疋 






p 2 n ( x)dx 




p 2 n ( x)dx 




V 


而不去 追求; U 和；1 2 的最优选择. 

注我们可以证明下列一般性命 题:设 / Kd 是（一 co ， co ) 上非负连续函 
数，满足下列 条件： 


p{x)dx=l 

J —CO 

且存在 一 00<0；。<$<^ 使得 X < X 。 时/>(0：)=0,在（1。，^)上/>(0：)是严格增 

■ 参 ^ ^ 、 • / 、 l. *. tv ■ m 身 ▲ ■ 罾 — /— 、直 

凼奴，茌 a ， oo ) 上 / K ： r ) 是严格硕 凼奴. 则句 卜列 頊汜： 

(1) 对任何 ye ( o ， l ), 方程组 


p (x)dz = y (a <C b) 


( 3 . 3 ) 


p(a)=p(b) 
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( 3 . 4 ) 



有唯一解 uw ). 


/ L /-#* f-rr -VH* r-l ✓ rfc r\ v 上 i* , \f . ~T^~ r 、丄 7T*il B .1. .、, ATJ^ ft _ * 

U ； ATI 士 1 p J 俩疋 ^；Hy ajOj^J J o—a 込到取 / J 、 但，必观 丑只而 a = a , 

6=6* . ， 

t 

4 XHH ^ rf/HVFFt ^ 芒 、 m 斗 n / A ， 芒、祕古 lift ：、 一 席值 

ML 刃 ：>rj |丄 l M j 从 v- v 上 o 1 1 ksi c*/ ^.//\<^/ ， tj 「pi ~ — 1/\wy istinr 

rb{a) 

4\ ( h\ = -Zi ^/j ^ 启 I 扭 1 _ 4 女 A^/7^-&/7 & dS JMr ^h( n ^ = -h ( t 、rl t Oil 

N v x X x • ^C/ yT*M y y i I 7v^ h V 1 ■— VZ^4 # 、中 ' 讲， 尸 \ 山 / ^***^ • jT%^ 

J a 

0 U ) 是连续函数，且 iim ip ( a ) = r p ( x)dx = 1, iim 0( a ) = 0( 因为 

- 4 0 Jjr 。 . * 

lim fe ( a )=^). 故一定有 a * 6 ( a ，6) 满足 ( p ( ci * ) = y . 令 6* =6( a * ) •则 （ 〆 ， 
«/ 6 

6* ) 满足方程 （3.3)、（3.4). 

若 U ，6) 也满足 （3. 3) 和 （3. 4)， 易知 x 0 < a < e •若 a < ，，则 p ( a )< 


p(a # ) = p(y )>p(b ) •于是 b>lT 


朞 


c# ww 

从而 p(x)dx > 

w Cl « 


p(x)dx = >S 这与 


, r 


» 


/ o o \ -Lrt C£^ 1=4 -m Hfcf* 、 * Rtrl TT'T -W* i f ■/ \ 1 、 、- X* I— * v * >4** t~t 

K6. 6) ^7T)B- I 口 J 埋，石 M J fff LtJ # pKX)ax 7^^ CL yO 俩疋 

J a 


3. 3) 相矛盾 • 故 a 


b* ，艮 P 方程 @(3,3) (3. 4)^P^ — & 


令 


Ca+c 

/i * J%( rt \ -H t r\ nr - fflll d/ 彳 /t 、 ^t\( /i —I— — */i T ^ — 

J 1^ \ v» / jf 、山 / j ys^ Y ^ N W •- I ^ / X V*. ^ • J 

<2 


4>(a* )= i>(b* ) - iy(a* ) = 0. 另一古而 . ^ a <T a* 时若 a 屮 c C a* _ 

# 、— ， ^ ， _ ▼ / _ ，令 ， ■ i — ^ — - w ^ — * - — 〆 ，， 

/ I V w / 乂 / 1 / M M. I 、、 者 -I _ ^ M. ^ I VTtftl I M, I 

/Ka 十 c; >/Ka 八囚 ft U" ,a " 十 cW ， 右 <a 十 cjWja 十 十 

c •，于是 /Ka + c ) > p ( a * ) > p ( a ) ，.总之，当 a < a * 时 ^( a ) > 0. 同理知 a > 
a * 时 〆 （ a )<0. 故 a * 是 # a ) 的最大值点，即 ) ( —切 a ). 设 a , 
6 满足 （3.3) •我们指出必有 6 — 用反证法，设 6 — a <6* - a * 

_ fb fa-\-c . _ 

=〔则 p ( x ) dx < p ( x)dx = Ha )^ Ha ^ ) = y . 这与 a ，6 满足 （3. 3) 相 

i w 

v bft w u 

矛盾. 故 6_ a >6* — a * . 

最后证明：对任何满足 （3.3) 的 a ，6, 若 6 — 也满足 


(3. 3)) ，则砌 =a%br =b\ 实际上，令 ^ =th-a x Ma) 


/K ： r)dr •则 ^(ai) 


广 j 

t\( ：=V = Vi ( */i ( "r'i Air ^ fh(n ^ dT III. i(n^i >/i - /?,; 女 5ll 福 

y f2 f «/ £Z ft/ 41 




故 4Ka' ) = 0 . 即有 

- ▲ r t 


/>(ai +Ci ) —/)(ai ) =0. 


这表明 P^b\ ) = p(a\ ). 由于方程组 （ 3. 3) — (3. 4) 的解是唯 一的 . 故 = a * ， 


■ 
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b \ = b * . 

人 -iat izr hk 
王即肛干. 

( 二）正态 分布 . 

^rL -XT X r X 9 \ t'—I JLn irrt r I -Lb. t f i -f-*, A*rt 令 

议 A 〜 m ；/， cT 八 I 口 J :3( U 1 RJ 爪忏平 A ! ， •••，△„ 仪 DP 不沖麥双 p 

的晉信反问和一的晋信反问？ 

^ ^ ■ ~ ■■ | I -4 •- ■ ^ P~* ^ | H ^ ▲ _ , • 

这里可细分为三个 问题： 

(1) 已知〜找 y 的置信区间； 

(2) 未知…找 (T 的置信 区间； 

(3) 未知 CT, 找 " 的置信区间 . 

我们可分别找出相应的枢轴量.对于（1)，自然想到用样本均 
值 X 估计可以证明又 一 沁服从 iV (0， l )( 见下面的定理 

3• 幻，从而 A 是枢轴量 . 对于 (2), 自然想到用 S 2 = 

X) 2 估计 cr 2 ，可以证明 7；= (n-l)S 2 -4 服从 n-1 个自由度的 〆 分 

o 

布 ( 见下面的定理 3. 3), 从而 7? 是枢轴量 . 对于 (3 )，可以证明 

9 

T = ^/n<jX — fx) 

的分 布与 ; i ， (T 无关 ( 见下面的定理 3. 3), 从而丁是枢轴量 . 

为了证明上面指出的几个结论，要证明几条在统计学中应用 

广泛的基本定理.先从/分布的直观意义谈起. 

足埋 3. 1 坟 A! ,-,A w 相立独立冋分布，共冋分布是 

N (0，1)， 则 J]X] 服从《个自由度的 / 分布（密度函数见 

1 

d 2)1 

\擎 -—，，騫 

证明 ：这是 初等概率论里已经证明过的结论.证明方法是计 
算 6 的分布函数，然后就可看出 $ 的密度函数正好是 （ 3.2 ). 这里 
从略 ( 参看 [1]). 
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系 3.1 若 f 服从《个自由度的 X 2 分布，则^=心 
这从定理 3. 1直接推出. 

按照习惯的记法，如果6服从〃个自由度的/分布，则记 

为卜; C 2 (72). 

对于/分布的变量，有下列重要性质. 

系 3. 2 设 e 与 相互独立〜 X 2 ( n ) , 7 ；〜 X 2 ( m ) ，则 


尽+ y 〜 X (n -f m ) 

证明 ：这利 用定理 3. 1 甚易推出，留给读者自己完成. 
定理 3. 2设兄，；(： 2 ，…，相互独立，且 


X •〜 N( tl ； %(7 2 ) (£== 1 • 2 •… ， 72 ) 

&• 、 J - v r r ， ， ， ， ， 

A = r ^ ^ 略 tp 赤祐 rot 

几 y ^ ivi 丄 r~r ， 


Yi = ^ a ik X k 

k=\ 

则 I ，…， l 相互独立，且 





1，2, 


• • • 


， w) 


n 


Y ‘〜 N( ^a l ) 01 ， 2 ， … ， w) 

• \ *"-/ 作 / 


证明 ：先考 虑特殊 情形: ; a =0 U = 1，2, …， n ). 此时 X 


x „ 的联合密度是 


n 


任给定6， 


\/ ZTia f 

I 7 X 


exp 


I 


» m a 

lg 



则 
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P(Yl^ tl ，•- - yY n ^ t n ) 








D 


( 


n 




W ^( J / 


exp 


! 


n 




o z ^ 

La ~ 


(4 女里 rl t = HT"-. ••• Ht* 

、 f - 丄 、■^ 

/1 V 

作变数 替换： 


n 


n 


yi = ^] a ik x k _( i = l ， 2 , …， 72 ) 

^=i 


则 


n 


K \ 

0Ci = y ]a k jyk Ol ， 2,… ， w) 


k 


变数替换的雅可比式为 


工 1 


x 


n 


y \ 




A ’ I = l 或一 l 


又 


n 


n 


"V ' o o 

= 2 J ^ 


故有 


P(Yi< h , jY n < t n ) 




— oo 


n 


n 


ex P 卜点 如 


_ • _ 


dy 


n 


TT 

11 




- 00 v^TTcT 


_1 — 1 」 _. 

c ^ y \ u r y ' 


-^r* »Uy- —»-!-* — • .A., 

liiJtLAT 1 曰 泛口、 J f lj 


oo 


>CH 


P(Y i ^t i ) = 






V 2 


丌 a 


l V 2 h 

exp ( _ 27 / d3，i 


u 而 

/y v iii^ 


n 


， ■ 文， ^ -v I ■ 穿 、 /^ v 

，•••，' ^ tn) = 1 丄 m 


这表明 I ，…，八相互独立且服从同一分布 n ( o ， ct 2 ). 


雖 
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现在考虑一般情形.令乙=足一~，则厶，… ，乙 相互独立， 
都服从 N (0， a 2 ). 根据刚才已证明的特殊情形，知…, 

k = l 

n 

J ] a nk Zk 相互独立，且 

1 _ _ 償 

** I 

n 

a 7 一 WA -2 、 

/ A ^ik^k 〜 y 
A = 1 

山 ~n. 

W 丁 

n n 

Yi = ciikZ k + dikfik (z = l ， 2r“ ， w) 

k^l k^i 

故 I ，…， l 相互独立，且 


V 一 \T f ▽A … 一 2 、 r ： —1 9 ... 

丄 Z — 11 \ y J ^ikf^k tu y v ^ — 丄，。， ，以 / 

A = 1 

证毕. 

定理 3.3 设兄，…， X „ 相互独立，都服从 JV ( p ， cr 2 )， 则 

⑴又 = 你 ，•〜 + 香） 

X 

(2) ^^( X .- X ) 2 〜 X 2 ( w -1) 

a 1 


/o\ t =： t v — ~v\2 -to- ft^ rrft -rV 

vo / —j — y \ / to 

l 

明 ； 取 w 阶 IF 夺钽陈 A = ( i :) 伸得第一行元素令县汶 

■ , ， • W — • ，V ■■ _ _ , ，■— ■ , ' IJ r W ' ^^0 ， ■ ■ ， ^m w 厂 ■— , 

v« 


44A AA tt- 士 ibii B 士 A A 人 

汗 tTJiiDC ： 疋 FF 曰於疋乍 n 


n 

Yi = y]a ik X k (z = l ， 2, … ， w) 

k=\ 

U 由拥 2 ?4rKV,」".V *H 百妯古 . 日 V, 〜 /V 卜 / W. 〜 

/y V /VI*, v • *-» 7 ▲丄 7 7 n "in ― L- -it- 7 J—U ▲丄 ^ x V # 、卜 7 \j ， 7 ▲ l 

iV(0 ， (r 2 )(f = 2 , …， 《)• 于是 


X = 



〜+誓) 
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由于 



利用定理 3.1 知 


n 


n 


2 m 



服从 7Z—1 个自由度的 X 2 分布.由于I，…，八相互独立，故叉与 


n 

V rY . — YV *0 百妯古 

/ J v ^ 1 r l M _• 

1 

471： 比 

Wi-T - * 

顺便说一句，定理 3. 3 的 （3) 是正态分布极深刻的性质.经过 

:抑 1 nr ^ rA *" 米 门士 卞女八士 一4 -士、士 人, ui - 由 故 上 rfe 

现 i 、 trjf 不八 wr 九沖退，只书 in^TT^rp/i ^ 込」 T 土灰 • m w 孤，石 

\ 

一个总体的样本均值X与样本离差 i (足 -X) 2 相互独立，则这 

1 ^ 

个总体必服从正态分布. 

-fc* *rtn o o -rr^ /.'-r -=rr t\t 4Jx tit -r- AV -A- ^ 4^ A A / 士 tzr iVrt 

书 J 疋观 i o^tTJciu HI 以仪卬 it 忍万 > rp 麥双 trj 且 1 日 

设 X : ，…，; ^ 是来自 iVOi ， 〆 ） 的样本，从定理 3. 3(1) 知 


+ V 5 T ( X -") 〜 N (0,1) 


■— I • A * / V A • U fe / ， /JL^ ■ 辛， A*ri 

宜 m 您万 叩双 但衣沖 



a 


U — 

y » ^ 、•■息 , 


<1 


Qfi 


、 




0 


于是， (T 已知时区间 
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X — 1. 96 -pr^X + 1. 96 (3. 5) 

一 '♦ qn vw - 

备" 的晉信 7k 平为 0. 95 的晉信 DClIK 旦汰说夹.加里做100汝柚 

- I I— I ，， ▼ I ， ^ - - — — n _ a~■• I 9 — V r • « ^ w / 、 ■ I V w , _ ▼ , , , _ ▼ |*^v — _ _ ^ r—» 

ft. 、慶 ^ k _ 參 \ t Ml i W # t # 倉 _^ w _ 参 f__ 童 ■»■ ^v _^b. 、 

怦 C 母仄捆 w 个早兀），则异出的 A 但大 約有 9b 仄便得区 |BK3. b) 

〆 

t 

包含 ~ 当然，也可能碰到这个区间不包含 ^ 的情形，但出现这种 
情形的可能性比较小，约为5%. 

我们还要注意，置信区间的长度与样本量《有关.当然希望 
置信区间的长度越小越好，但为此需付出 代价： n 必须大.故在实 
际问题里要具体分析，适当掌握，不能走极端. 

例 3.1 某车间生产滚珠，从长期实践中知道，滚珠直径X可 

• V . 、丨 、• i. _ t . . ■ — * 太 ,1 ^ - ^ . t ^ • ft 罄 • _ v * w # - ▲ * ^ # |gf t. I t - ^ A 、 t " ■-丨 ^ 

以认刀是服从止念分邗的.从呆大的广品里魄机捆取 b 个，测俜 

直径如下(单位: mm) : 

14. 70,15. 21,14. 90,14. 91,15. 32,15. 32 

试估计该天产品的直径的平均值？如果知道该天产品直径的方差 
是 0. 05,试找出直径平均值的置信区间（置信水平为 0. 95)? 

易知，这6个数的平均值叉 =15. 06(mm)， 这就是直径平均 
倌^的估计倌.刺用 （3. 5) 知 w 的置信区间县「14. 88,15. 241( 置 

，一 - - - ， w - • - W w ， ■ ~~W ，▼- M - ■ , _，■ _ , • ~ • ■ W ， ， 

信水平为 0.95). 

如果 a 2 未知，需要找 Y 的置信区间，从定理 3. 3知 

W ^ \ (X, — X ) 2 〜％ 2 (w — 1) 

° 1 

査书末附表3, 有; U,A 2 使得 

PiXi ^ W ^ Xz ^ —0. 95 

于是 


D /i ( V _ ( V —"^2、 — A OC 

1 、 / J wv I 八， / J Wii 八 / J — V. VO 

2 1 1 1 

这表明 a 2 的置信水平为 0. 95的置信区间是 



(3.6) 
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可类似地找出 a 2 的置信水平为 y 的置信区间. 

i 

■I 1 # . f >il O I . # “ ▲ •… * ▲ t •、 # m /_ 簋 _ • -、 ■_ 一 

规在 I 口 J : 如朱 〆 禾知，如例找 # 的置信区问？ 


T ? 

ru^ 


n 


S 


n 




ll <±riW o o tm 陆士 n tiV: 且工 [f v — \ t^lo-ta-rrxr4t^V T7 

o. o 7^JLa ， pam 又里 — v " 、八 — 。，入 

a 厂 


a 


1 


a 


\/ n(X — u ) 〜 NXO ， 1) 


(3.7) 


n 


< y 2 ! 


2( H ) 2 〜; (72— 1) 


(3.8) 


于是随机变量 


rrs 


^ n ( X - 

s - 



的分布是完全确定的，与 per 无关.显然，如 果了的 分布函数能求 

山 ： sfe imiT?r 秘说 h 估但 

UL| 小，； ] 人 A LX ； ITT 


P ( I T |< A ) = y (0 < y < 1) 


(3.9) 


于是 


尸 l 


( X-X S 




</.<x 


I 

™r 


S \ 


7 


这表明 // 的置信水平为 ^ 的置信区间是 


一 c — c ' 

X-A^,X + A^i 
Vw \ Jn ，、 


(3. 10) 


: r 的分布函数是什么呢？ ： r 服从所谓 „_ i 个自由度的 < 分 
布. 《分 布的定义是这 样的： 

定义 3.3 称随机变量 f 服从《个自由度的 《分布 （简记为 
e 〜 〆 W ))， 若 （ 的分布卷度是 


r( 


W + 1 


rrhl 


Pn(x) 


r (音 )▲ 


l 



X 


n 


(3. 11) 
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'■ f 分布的直观意义与重要性在于下列事实. 

定理 3. 4设 $与1；相互独立 ，卜 N(0 ， 1 )， 7 〜 f («) ， 则 

UZ 

5 S /V « v 

CM U 人 h 山 cte AA i /V -A-r 

m /)\ n -r 0 ttu^trj i ttw - 

证明：这个定理在初等概率论里已证明过.证明方法是计算 r 

—一 ^ ， 一 — • r w ^ r ， ■ - - — ▼ ▼ ，爭 ， ， ，^― ▼ ， m w 

的分布函数，然后知道 f 的分布密度正好是 （3. 11)，这里从略（参 

宭 n ~ h . Ud . 7) .n R ) 乃宗捆 L 4知随机亦骨 T fll?U w — 1 个白 

-|_ — j , w ，，、、一 一 , f 、一一 — , ，从 j- 史 ■- 一 - — ，，” I ~t 1 ： v «# — 、-, — p 9—| 

由度的 （分 布. 

w 分布的密度函数是工的偶函数.当自由度《>25时 《分布 

的密度曲线与标准正态分布的密度曲线极为接近.可以证明 

lim /?„( jc ) = ^( jc ) ( — ■切 

n 

这里 〆 工 ） =—^=*exp | _•■|■• r 2 j 是标准正态分布密度.证明是不 

V 2 n ^ ^ ) 

推的.谱选若白 R 穿成（椹示. ffl 浙蛑肽公才1 

, ,r*- ^ r-f p—I ， ^ i ,,i n r i * ， 、，- 

t 分布的分位数表已造好，见书末附 _ 2. 

据上所述，若兄，…， X „ 是来自 N ( p ， ff 2 ) 的样本，对给定的置 
信水平 y ， 査 i 分布表可找到 A 满足 (3. 9), 从而得到 "的置 信区间 
(3. 10). 


例 3. 2 用某仪器间接测量温度，重复测量5次，得(单位 ：° C )： 


1 250 9 1 265 9 1 245，1 260，1 275 


问 ：温度 的真值在什么范围？ 


A'-t >ca s 44Tt 、-^人 n tmr /r^ 此 . i\—t Fnzr tm -=§=t 一赢 .m=i 上 “ -rf=* 

识 IfJIR 任匆: JC 込 /「 l a J 越礼 / DCiXX / 子 IRJSS . 用"衣乃^祖皮 tfj 具 

倌， X 丟示涮 量倌. X 诵當服从 TF 态分布，假宙仪器无系 

， ■ ■ , ，，- ▼_v r ，， ~ ▼ , ， r ■ 爭 ,^ _ ， ▼ ■ V ■ , j - ■ p _， ▼ w^w ^ » 

偏差）.上述5个数据可看成是来自 X 的样本.问题是找出^ 

的晉信 5 Tl ' gU 古卷去初） 

”V I—l. J I—i »=~— I' -4 、/ ■ - , • ▼ /, • 

利用上面的理 论，" 的置信区间是 (3.10). 现在 《=5， X =1 259, 


n 


s 2 




570 

丁 


为了找 A ， 杳附表 2( 沣竟自由度 
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= W —1 = 4) ，对于 7—0- 95 = 1 — 0. 05,査得 A = 2. 776,于是"的置 
信区间是 [1 244. 2,1 273. 8] (置信水平为 0. 95). 

[ Ml - 进米 fr / V : fein 7 Tr 太/ V 允66会糊^卄於了 妥 il 田被址县卡 

_i—/vj jh yj -in h jjL*)Qi 、 j4 w J ^ xa. k .j *^u j >h irj/ ij ， im-rw yj 

法寻找置信区间.对许多其他比较简单的分布，也可类似地得到 

矣撕糾里佐 mvn 分 m 丁 人4刀 ~r 

%5 txprj 且 In m 口 j ，込王， I 、 - )\ t^n J • 

枢轴量方法有两个明显的 缺点： ①怎样寻找枢轴量？没有统 
一的方法;②利用枢轴量方法得到的置信区间有何优良性质？没 

有明确的结论 N 

■ ， ，， -/ 1 F— » i - W ， 

现在介绍寻求置信区间的第二个方法——统计量方法.设 
X ^- 9 X n 是来自分布函数为 FUd ) 06 0) 的总体的样本，0是 

秦 -»• ^ — — • ▲ - _ & ^ 蟲 — * - _ . = . I A ^ 

任意非空集合 4( 仍是 0 上的实值函数.设 〆 兄 ，•“ ，尤^是任何 

中估姑 1 、+ 甚 A 

) 人二 layu M m Y 

G ( c 9 d ) = Pe (< p ( X x , ••* , X n )^ c ) (3.12) 

t 

tr/ ^ r\\ —— r> / / v … v w / — r o 10 、 

n \c $uj 一 r e \(p\^\i , - ^ V — vo. xoj 

这里 P , 是与参数彡相应的概率.易知 G ( cj ) 是 c 的左连续减函 
数. 给定 0< y < l ， 令 

cr, (r) = \r\i ( cr(ft) .f) fi) 0 OCr ./9^ — y } ① （3. 14) 

I J 、冒 , 一 _ — ■、' V , • V ' L ■ 、 一 , W , — 0 / 、一 - — —, 

gi /( c ) = siip { g (0) ：6 E © S ^ H ( c ,^ Xy } (3.15) 

我们有下列重要 结论： 

定理 3. 5 (1) ，… ，足 ）） 是 〆 们的置信水平为 y 的 

租佐 -TTKH Bn 
且 I 口 I rrc ,叫 

Peigdd ^ gLiipiX , , x n )) y^y ( see ) (3.16) 

ZO \ / / xr V、\B _ / /1\ AA / 士 丄 TIT “ i 4 /t BS . /士 L 

guK < py^i ♦ ^. n )>-m g \ o ) trj 直 i 自 / n 丁力 / 们且旧丄 

限，即 

Po(g< ： ^<gu((p(X , ，…， X„)))>y ( de @) (3.17) 

m 份 CT, = min r £Tr C rn ( X, . ••• . X.. ) ) . rn,T ( rn ( . ••• . Xl ) ) ) • 

、 w ^5 1 ■■■ —，■、^ v — * x 7 ，一 • Tg , ' 7 、與 ，丄 ' i fi ，'， f 

t ' 

I 

①当不存在 0 满足 G(c ， 0)>l —y 时 ，令灯 （ c) = supU<^) : 托 0}; 当不存在 0 满 
足 f/(c ， 0)<y 时，令 gyic) =inf{g*(^) ： 06®} 
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= max (^ L (^( X ! ， … ， X„)) ， <pu(<p(X” …， X ”））） ， 则[心： 2 ]是 
g (仍的置信水平为 2/-1 的置信区间（当 0. 5< y < l 时). 

々 TT 口日 (n 、S ^ nT U "TTT5T 々 TI ： ^tiA^1 、 

ku-ryj : voy 《、々 "j / 7 \^f kj v 丄 / th v ^ / _a jyx：ipi U4 • 丄 / 

成立. 

m <±r n /^ r / r \ 4 UWi、-f 士 2 ：T 口口 

l^l ML (7 〔 O ， K II J 不 UE 切 

PfXs(&))<isi (( p (< X ' ，…， X ”）） X 1 — y (3. 18) 

， 、 / ■ ^ *- - - — w 

为简单计，记2= 〆 ^ ，…， X ”）， 则 G ( u ，0) = P 0 Ou ) 是 u 

的减函数.今 

r 7， ' _ ■ ，^，曹 、 

Co=inf{c ： — oo<c<oo,G(c,^Xl —/} 

分两种情形进行讨论. 

CP G{c,o,d)^l-y 

此时 A ( g (6)< g L ( Z ) )< P ,( G ( Z ^ Xl - y ) = P ,( Z > c 0 ) = 
G ( c 0 ，dXl — y . 故 （3. 18) 成立 • 

② G ( c 0 ，汐) >1 _ y 

此时 Pe ( g ( d )< g L ( Z ))^ P e ( G ( Z , d )< : l - y ) = Pe ( Z > co ) 

呈 A . 

八 — k /:、 _ —〜一 »LL^ rt-4^ A — A / !! \ _ — *LL^ n-4^ 

7 T 二 rr 旧刀 > 5 欺馨 uyc 0 — ％口 、 J 八 一 U; uiyc 0 —— … ，此口 、 J 

A = lim P e ( Z ^ — n ) — limG ( — w ， 沒 Xl — y ； ( iii ) — °°< Cco < Coo , 此 

n n 

时 A = lim P $[ Z>c + 丄 ） = lim G ( Co + 丄，— /. 总之 1 

n V n ) n \ n . } 

# 

_ H / o i o \ »-4>> —I I / r\ i r> 、 -rfc- 4»-Ar 4-/^ A*" / o -i /^ \ >-4^ —m r=f JJk4. 上 A* — 

— 7 ， fiXA 丄丄〜只乂兑 . /AW. 107 且汝畑 : WU <5. 丄 0; 肌兑 . 用|円杆的刀 

法可证 (3. 17) 成立.定理 3. 5证毕. 

* 

It A. /、 * * I t=^ 丨.參 f 、_ —f l~t J i a _ ■ ■ 窨 a ^ ^ 产崖 I 

从一个珧 rr 重 9=0X2 ，…， a„) 出及 ，利用疋埋 i b 侍到 
的晋信下（ h 胭 乃罟信 5T 问的古法 ml 撒统朴暑古浓 t 阮命 

o 、 V ， I-* V 1—■> | H-l I 、 ■ -， I I^V i—t* I H r _ . 厂 W v /V - I irw w I /v • -> X'S ， / .丄 

用此方法时，通常取以们•的一个估计量或估计量的一个增函数作 
为统计量 9 >(兄 ，… ，又） ，而且要使得 G ( c ， 们和 H ( c ,^),^ l ( c ), 
guG ) 都比较好计算，才便于获得具体的置信限或置信区间.这些 
都需要具体问题具体分析. 

例 3. 3设 x 服从伯努利分布，即 
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> P(X=1) = P=1-P(X=0), 

靠 詹 * ‘肅 1 竺1 ^ ^ , - * '土 . • ， __#_ # _ H 产 纛 _ » ' ^， _ t ^—、 

兵甲/>是木郑蔘奴，冏••卯 佃从 A 的枰不 Ai ，* V ， A „ 找 
屮/>的罟信下胆？ r 罾倍 士疋基 w 

•-■-■ H 4 ^=±« IH I | • v HH，j 、 I >a& 4 / • 

n 

易知，/>的矩估计> =^]足/«，取统计量 ( pW ， …， X n ) = 

1 

V' V Xv 
/ J 〜 7 

1 

a ( b .^= P ( rn ( Y , . Y 、： 

^ \ • v 7 尸 ， ▲ \ \^y \ ▲▲丄 7 7 ▲各 ft / >-^ ，V X 

n n 

当是=0，丄，…， w 时 g (々，/>) = p ( Y i x i ^ k )= Yi a np i a - py - i . 

多次使用分部积分公式得 1 i=k 

y> I rp 

^ V 1 v 'v mm T f 1 v ^ • 黨 — 7 k 肩 i 

u 、 k ， p )= — ~~ —fj - — x ^ i a - x)^ K dx U 彡 1) 

(々 一 1 )! (w — 々）！ Jo , 

i4 — :LI, TTT m 1 1 "-L ^ / i J \ P» . 上“ \Tir 丄知 \-^ A=fc ^rL . ✓ i \ P» 

ttlltLKI 见，丄 n、j LrKR 9 p)M P 的 厂份 項迁溪 EH 戮，议 pKR)^ 

方程 Ga，/0 = 1 — y 的唯一根，则 k ^ l 时从 (3. 14) 知 

p L (々） = inf { 夕 : ，G (是，/0>1 — y} 

= p ( k ) 

另一方面， G(0，/>) = 1, 从 （3. 14) 知 h(0)=0 .记 M 0)=0 则泠的 

- ^ ~ -— 

A 水平置信下限为 . 易知 G(l，/0 = 1 —(1 — /0”， 

— Z = 1 

G ( n ，/>) = p ” ，放 / >(1) = 1 — y 士，夕 (??） = ( l _ y ) + •当 1<々<« 时 
夕 a ) 无显式表达^下一章将给出#算公式. 

羊 >/ 门 ife Bii 士匕山人 / 衫、一 /1 — 〜 、冬曰 u 士 m dss e iVt 击 m /人 
^ IIJ 1^77^10 U4 9 y\n/ — 、丄 ，厂‘疋丄低 _L ； i!L /TJ m\ ) 口 U 里 3C 

式.例如、，为了估计其神垧弹的发射成功率 />. 讲行了 20次试验， 

,•， 广 ▼ ■» v r T^ * , ， — 丨 • ， ▼ _ , ▼ ▼ ，〆 ^ r ^ ^ ^ ^ 1 ■一 ^ ， w ■- 

* • 

结果每次都成功，则 f 的 0.80 水平置信下限 p L = (0. 2)^ = 
0. 922 7. (1 一 y) +乃是无失效情形下成功率的 y 水平置信下限. 

白狄苗 (H1. 县本右 t u ( Y, ..... Y B 

»^r >“、 ■ v • >m— i~4 nj 中 \ ▲ 1 i y 7 ‘in ， 

Pp ^ P ^ fpi^i »*** tX w ))=y ( _ 切/ >6(0，1)) (3. 19) 

答案是，这样的0(兄 ，… ，尤） 不存在.用反证法.假设有这 
样的 0. 记 a = 0( l , …， 1)( 自变量全是 1). 分两种情况 讨论. 

• 56 • 




① a < l , 此时当 />6 U ，1) 时 y = P p ( p > ip ( X 1 9 X n ))^ P p ( p ^ 
0( Xi ，…， X „)， X 1 = … = X fl = l ) = f %( X 1 = …= : X „ = l ) = />”•令 

A ― w 1 "^旦 ax 1 B& I ^T\ ^ 1 lU^ Dri" ^rf * 4*71 人 〔 A A 1 、 "^5T "I 〜 

y 产丄 ITT ， ^ 1 » /J y 曰： w. JP- i ♦ ilia M'J y\*j 一 *5M // LU » 丄 / '曰丄 / — 

Pp ( p 〈* p ( Xi ，…， X n ))^ P p ( ，…， X n ) ， Xi = … = X n = . l )= 

• ” 人 • ^ i i _ -i 、上 x-f I•* _ . ✓— / r\ i \ _Lr*t c£. ^4 ~r* ~rrC APi -/-* 

p • 々、 P —" 丄恃丄 — 7〆 丄 • 込乂勺 /t: ■ ，丄日 1 泪 . 起、心，个 W J 目 E 句 

di(Xi •••••D 满足 （ 3. 17). 

、一 一 x , r — ' ~ ， i ， ^ W ~ *^ f 、一 - — , ， 

I 

用同样的方法也可以证明，对任何76(0，1)不存在0 1 (足，*“, 

Y ^ Cj^ ( Y. .... . V 、难 M 

« n ，中乙 y 7 Ai— 

卩从⑶，…， x „) < 夕 <02 (^ , … ， X „)) 

r 

(对 一 切 p ^: (0 » 1)) . 

但是，可以证明 

,n 

inf P , ( /> /> ( 兄 ^ ^ = v 

— p \ r \ / j * * i / y § 、 v -— 

p —— i 

4 士 田 的由以 m Rif . en ^(c\^ = (\ b^>A 么广厶、且七班 ruh ^ = 

AGr -T\ K、•、/ At, 夕 U 卩 VI 7 *^r if \ w ， V y rv a m g ? \ rv / yj* ^p ， 

1 — y 的唯 一 ^根. 

1 我们可证明下列’^般性 结论： 

定理 3. 6 设 G ( c ， 的和 & L ( c ) 分别由 （3. 12) 和 （3. 14) 给出.若对任何 
e >0, 存在样本值 U ?， …， Z ) 及 f 6 0满足下列 条件： 

(1) gL(<p(^°l J*** yX 0 n ))=g('d* ) 

(2) G(<p(x°i ,••• ,x°) yd' )^1 ~y~£ 

(3) 有一列夕 i ，沒 2 ， •• •使得 ) 且11|11 G C < p ( x°i , ••• ， x 0 n y ， Qk ) s 

k 

G \( p \ X °\ » … fxl ) yd * ) ，贝 ! J 

\n{P e (g(d)^g L (^(Xi ， … ， X„))) = y (3. 21) 

6 €& 

证明：记 Z=<p(Xi ，…， ) ，之 0 =<p(x°i ， … ， d). 从 （ 3. 16 ) 知 


r < infP fi (,(.)^( Z ) XP ,(,(^)^( Z » 


令々- ► oo 得 


<Pe k (g(d* )>g L (Z)) = P 0k (gL(z i) )>g L (Z)) 

ft R 

= 1 — Pe h (gL (Z)^g L (z 0 ))^l — Pe A (Z^z 0 ) = 1 — G(z 0 ，氏） • 

# 

i ■ 

_ 

*„ / r» / / n\ / rz\ 、 i r^/ n* \ ^ *. I 

ini r QKgKOJ^gL k 厶丄 —LxVZo ,C7 ； ^/-T£. 

e^e 
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再令 e — O 知 （3. 21) 成立. 证毕. 

■ _ tnj t / y 'W T ，铲 、、 ■ ▲ ▲ Vt/^ /_、 i • _ _■ _ It 

对宁直 1 g 工隈 guK < pKA x ，…，令失似 ay 疋埋，从 嵴. 

从定理 3. 6 容易推知 （3. 20) 成立. （取： T ? =…=1〗7 l 9 g (0)=090= pf 

-4 

8* = p * = (1 一 y )+，dk = pk = x p * (1 _ "* t ~ j ，灸 = l ，2，.*.， 即知） • 

从定理 3. 5 和萣理 3. 6' 的证明过程知道，我们并没有利用兄，…， X „ 是 

“ AttC XT *: +T 1 44A - A - W AA llL. t=C- ri 7 »T / V V \ H thrti -I4t - U - JOT 由八 -Ar /*r ~ C ： Ab . 

ibj 平 warn 忏平 trjT 土 J 1 贝，只安、 ai ，… 》 A „ y 疋 waiuiRj 里，升佩羋 tt 叩 m 规丁沙 

数 (9 即可.因而统计量方法应用极广.既然从任何一个统计量 〆 兄 ，…，; O 
出发都可得到 g (<9) 的置信限（下限或上限），那么自然要 问：这 样得到的置信 
限有何优良性？ 

为了表述优良性，先下一定义. 

定义 3 . 4 .设 < p ( xi ，…，: T n ) 和 < p ( xi ，…， Xn ) 是两个函数，称 对 < p 是保 

序的，若 X 才任何 ( 工1 ，…， X n )和（工1，…， x n )， 只要 ( p \ X \ ，…， X n / ^尹 ( X 1，…， 
Z ) 就一定成立 ipixx , ••• 9 x n )^ ip ( x \ ，•••，/„)• 

昧们 muniF 昍 T 刺 

定理 3. 7设 〆 兄，…， X )是任何统计量 ， g (0) 是0的函数，取（#不，…, 
足））和肋（^足，".，厶））分别由（3. 14) 和 （3- I 5 )确定 • 01 (不，".，又„)和 

r V / 1 M.t ， t t * , i ^ rrrt >-rrt / r - - — * I /|— ■ 

办 QAi ，…， a „) 甘別走 # ㈨ 的 y 7 jc 干重佰卜限和置 is 上限兑二有那用 > 走悚 

序的，则 

» / 'r 'r \ / / 'r 'r \ \ 

01 V Ai>••• ^n) > 

02 ( Xi ，…， X n )> gu (屮 ( Xi ，…， X ")) 

换句话说，由统计量？>导出的置信下限是所有对 p 保序的置信下限中 
最大的，由 p 导出的置信上限 ^7(0 是所有对 p 保序的置信上限中最小的. 

(注意，对给定的置信水平而言，上限越小越好，下限越大越好 .） 

1 

我们不叙述定理 3. 7的证明了，读者如有兴趣，可参看 [16] 的第六章. 

隨佰说 —钿.铱彳+鲁古浓右 _ 小笙伦才 - 垤太含间挑岗浓.曰去右 

， w 7 w 1 ra i u i i i r ^r ^ —l- h 4 ii / j ^ /n i—i i ^ 

时更便于应用（见 [16] 的第六章). 

你士太书的结匡.游们 描屮下 ■別而占. 

I I / v ，I »-• v ^T-i r\a t ii 4 4 口 I ，义 n j\\\ • 

( l ) 我们未对置信区间的优良性进行深入讨论，迄今尚缺乏 
统一的令人满意的理论.对一些特殊情形是有严密的数学理论 
的，参看文献 [2], [12]. 当然，我们应该找宽度尽可能小的置信 
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区间. 

k. ^ ft A ^h ^ ^h K ^ _ — •A • ■»■ & 

(2) 置信区间.的宽度一般是随机 变量. 对于 iv ( p ， 〆 ） 来说，当 
( T 未知时，置信区间 （3. 10) 的宽度是 

f 

I = 2 a ' 1 T!(x, -x) 2 

N nKn 一丄 ） Y 

i 取佶 m 能很士.不能鈴制白钬萆 ini . 县否右面宙窗_的晋倍 f 5 f 

V ， l-a. -J MU 膠 7 I jgu g-L- IH>J • I—I > 、、、 - =^H I -# • I—I 匿 »-=^ />*— JfMA K* V -fc^* I H 

间呢？可以证明，对于 iVC / i ,/)， 只要 ( T 未知，不管样本量 rz 多么 
大， / i 不存在固定宽度的置信区间.但可采用两阶段方法（样本量 
是随机变量)得到固定宽度的置信区间，具体理由见第六章. 

§4分布函数与密度函数的估计 


分布函数的估计设 X 的分布函数 F (: r ) 未知，如何从样本 
A ，…，估计 FU ) 的值 U 绐定）？这是很重要的问题.掌握随 

士口 Tte 县 66 牲 M* 故且苗志法亡 66 乂 V 女 ^Mr ■? 生夕舌苗 66 命 dVH Sff 苗 
vu 又里 mu n\r ■ 工肌 此又开 ir Hi m v yj ^h m 从 ， kt 夕生又 wy 方 r/j 、 i^j At2S3*r 

求估计 FU ). 例如在产品或生物体的寿命分析中，人们常常关心 

O / __ \ ml i44* T7T 
OVXJ 叫 ^ Mj 


■ j # _ % 

r kxj . 


古 V -i— -r. — «4A| -MfT -dbt O / \ (=1 处 o/ __\ _ 1 

可泊卩 a 人丁 i o ，亚？^ 0、 X / —— 丄一 

靠性函数或牛存函数. 

■ • ， ■• ■» ^ r ^ ^ ^ ■* W r ■—■ 

如果 FU ) 的函数类型已知，只是含有未知的参数，则常用前 
几节的办法估计未知参数，从而弄清 FU ) 是什么.若不知道 

FU ) 的分布类型，怎么办？只好用非参数 方法. 

给定 I 后，记^为，…， X „ 中不超过 x 的个数，自然用频 


率 F „( X ) 


d 


n 去估计概率 FU ) = P ( X <: r ). 


定义 4. 1称: r 的函数 F „ Cr ) 为 X 的经验分布函数. 

仕音_ 

11. >tii 、 ， 


-. n 

■¥"« ✓ 、 丄 X . 1 *W ✓ ，， 乂 

t n Kx ) = — 

2 = 1 

这里 L 表示 A 的示性函数.根据强大数律知 


參 
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PClimF ^ Cjo ) = F ( x )) = l ( 一 切： r ) 

n 

这是经验分布函数逼近理论分布函数的理论根推. F „ Cr ) 的表达 

tv i* V » A • , V 1 • 、 一 ■ li ^ . t J I * t > t ， *fcl t l I t - ■ ■〜 t 

式 : 口 j 以与侍更凊炬些 . 将 i ， … ，汝 m 从小到入 排列 ，恃到 

X ⑴ < x (2) <〜< x ( fI ) 其中； ^叫做第丨个次序统计量 U = l , 
2, …， 72). 易知 


m ^ ^ v 

^ 9 ： 4 ，、 ^ 八（ 1) 

b 「 

r\ ✓ 、 /v r ^xt ^XT x y ¥ -i r\ -i 、 

t n ^ x ) = <—, LAot ) , A (tfl) ； Ktz = 1,^, —, W — 1； 

n , 

、1， Jo ^ X ( n ) 

我们有下列更强的结论： 

定理 4. 1 ( Glivenko - Cantelli ) 设 

D n = sup I F n (x) — F(x) I 

x 

则 


d / i :_ ri —— a 、 —— i 

1 V Hill J^n 一 ^ y 一 丄 

n 

证明：设 y 是任一正整数，々=1,2,…， y . 令 

, — - ， V ^ •w 


， T 


4 I 


inf{x ： F(x)>^} (inf0 


d 




设 Lx Yfk ， Xy ,* +1 ) ，则 


/ X / X / r\ \ 

rnKXy^j^r^xj ^ r n Kx rtk+l — u; 
F(x y ,k)^ ： F(x) ^ F(xy tA +i — 0) 


于是 


F n (x rtk ) — F(xy f *+i — 0)^F n (x) — Fix) 


< F n ( x r , k +\ — 0) — F ( x r ,k 


由于 


k 


rs / 八 \ / rs / v 〆 / 

rKXy^k — ^tKXy.k) ^ tKX r , M 

/ 

h 4 - 1 * 

/ 


A 、 

u ; 


故 


0 < F ( Xy •奸 1 — 0)— F ( Xy t *)< 


y 


从而 


癱 
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F n (x) — F(x)^F n (xy tA+ i — 0)— F(xy fJfr +i — 0) + 


F n (x) — Fix) ^ F„ (x /t Jk) — F(x Ytk ) 


于是 


I ji n y i vu./ I 


FX 工 ）I ^ F n (x r9 k+\ _ 0) — F(x r ,k^\ — 0) 


I Fn (Xv.i ) _ F(Xy.i ) I + 

I - - € r 譬 ，•- I 


其中 1 6 [ Xy , A ， 工 y ，* + l ) (是 = 1 ，2,…， 1). 

当 ： T <： C y ,i 时， 

F n (x) —F(x)^F n (Xy t l — 0)^ I F n (Xy t l —0) —F(x y , 


0 )1++ 


F(x) — F n (x)^F(x r ,i —OX — 

7 


从而 


/ V ✓ \ / 八 \ / r\ \ * I 

t n Kx) — rKx) ^ r n Kx rA — u; — r^x y ,i — u ; 卞 


、 l>f rt-L T^/ 、 _ 1 

曰 ： rd ： y , y 口 、 j — 丄,吹 

I F„ (x) — Fix') I =F(x) — F„ (x) ^ F(xy,y) — F„ (x y , y 

— I F n ( Xy , y ) — FCXy.y) | 

(注意，我们规定 F ( oo ) = F „( oo ) = 1). 

总之有 

y 

sup I F n (x) — F(x) I < y ] I F n (x 7tk — 0) — F(x yJk — 0) 

，• i - 


T 

1 Fn {Xy.k ) — F(Xv.A ) I + 

” # r '' # ，一 I 


4 


令 


且 

由干 

■ I ^ 


Ay jk = { limF n (Xy.A — 0) = F(Xy 9 k — 0) 

n 

HmF n (x y ^) = F(o?y, A )}- (是 =1 ， 2 ，…， y) 


•I 

X 

/IX ( 


21 
II K 


p 


^ 

F 

， 

、夕 

•f 

X. 


21 

1- n 


从强大数律知 
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P(A y ^) = l (y^l jk = 1 ， … ， y) 


令 A = n n Av A , 易知 P ( A ) = 1. 伯县 

， - — - — f y r% » _ ▼ ，零 - ' - § ^ 

r=l A = 1 

A d { limD n =0} 

n 

所以 

P ( limD n =0) = l 

n 

证毕. 

经过现代的深入研究，还可以证明 ：对任 何6>0,存在常数 C 

/ I—r -V* \ /士 4Q 

^儿大 V ，仗1 守 

P ( D . > e ) < Ce " 2 ( n > 1) 

在实际工作中有时需要估计分布函数的分位数.设；是 
FCr ) 的/>分位数(0</><1)，即 

F ( xp )^ p ^ F { x p — 0 ) 

(即 P ( X ^ x p )^ p ^ P ( X < x p )) 

若 X ⑴ ，…， X (>0 是样本兄，…， X ”的次序统计量， y =[ w />] + l ， 我 

^ ^ ^ ^ ^ ^ ^ 麝 、 v ft _ ■蠊 一 一 »身 ^ m ^ m # ■ v # _ > ^ m 

1 IJ 叫用弟 r 个次序统计量人 <0 作为 a 的佰 计量. 川以址明， M 罘 

方程 “ F (: r ) = ，至多一个根(此时 a 唯一），则样本量无限增大时 
X ( f 0 就是；的强相合估计： 

/Etl j Q tn —X. ^14 - 4*ft 身 l "Ar ital rf^r vJbL 、耋 - o i r —_ A At A— 

lyy •• i 禾貝酣,汁）日切衣雎土厂棚疋印里刀。兮 。 g irj^r 

餐肉饉头，由干随机性.铤个縑 I 的净重都右胜差别.现从牛产线 

、 I ■w f ■■ 国 ， ， , ■ v ■"» i w f ■ » * ' ♦ f ^ ’ I' ■ ， ■ _ ■ • ， • 蠱 ， ▼ ▼- ， ^ ，， ▼ ■ ■ ■ ， -, 、 

丨 >»i t ■ f.k-t L I -r^* ‘ — a JL \ ■•_ 、V ^ * *** - ■ ■ * -v^t r t—t v -X # \ - 、 

上隨机捆取 1 U 个罐大，忏具伊里，得卜列奴惦 （早 1 E : g ): 

^AA ^19 ^10 ^^8 

丄 ▲ v v w 、 ✓ 丄 w x u v •/ i xy v vy 

344 343 344 34 a 

试求该生产线上生产出的罐头的净重的分布函数，并估计其中 
位数. 

解我们用经验分布函数 F 1() Cr ) 作为分布函数的估计.将样 
本值从小到大排列： 336,338，340，342,343,343,344,344,344, 

345,于是口 J 得经验分布凼数 y 10 U ) 卯卜： 
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r o , 



10 



10 


F l 0 ( x )=< 


in 

丄 \y 

4 

10 



10 


: r <336 

336<^<338 

338<* r <340 

340< x <342 

342^^： r < C 343 

343< x <344 



10 



344< x <345 

x ^345 


这就是分布函数的近似值. 注意 p 




r% 


时， Lpn ~] + 1 = 6. 故可用 


: Cm 作为中位数的估计.即罐头净重的中位数约为343 g . 

--- ------- 乙 --■ - ^ - _ 

如果随机变量 X 有密度函数 />( x )， 则应研究密度函数 PU ) 
如何估计.因为密度函数更能官观地刻画出概率分布的特性（如 


对称性、峰值等等），如何估计的问题显得很重要.特别是多维随 
机向量情形，分布函数用处较小，又不便于处理，估计密度函数意 

礓 

I * - rzrt 、卜 * *-*•■ i~r if-* — * 山 •• yL ^ i - - tnrt 、 v— nr» 、 _L、A »-*、- t.*-* 

乂殳7：，仕囵诼识別及岁兀刊厌〒安剃.这里仪 TT 化一维腿机 
亦骨的來麽估 i +问颍， 估 i + 古法右很名轴.汶苗首生介绍所中攸 

■TT—k 9^9 ^ , I—• , | ■蟑 , - | 1^^ P -# I V I , ■ _ P~» / ^ ^ i-^l ，/， 

# _ i> 嘗 # - *, • # - ^ ^ , g - > ■ # p # k *. \ ^ • ■ _ t t . iw — _ ▲ #w • 一 * - »•、 f 1 * - 置 & 

久，观在仍在厂泛便用的直万图法，然后介绡近 40 牛友辰起来 
的炫壮彳+法知 M 彳斤部壮朴法下而老鹵的瞄和亦昼检县述统 

" V 11-1 ^ I 、 r n-t ， I 1^-^ • I H-H V 产 HI v u 土 JEi ^ V AJ» 


型的. 

* 

(一）直方图法 

r * 

设兄，…，尤是来自密度为 /(X) 的总体的样本，用 K ( a ，6) 
表示诸 X ,中落在区间 U ，6] 的个数.显然积分 P /( x ) dx 可用 

J a 

ifeBf 农 ( n ^ bk \ "T~4* pfa /^V 由 Jbt* nr ^ ^ ( n ^ h 

y-?s -t~ 、认 77 ，/|、 im y \ • m-i (/ 外 w ~^r~ i m=l /、" i g m- … u 、- 

n 
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使得 


f(jTn) = 

' — V 广 



，b 

— f(jo) Ax 

、 — 一 ^ --- 

CLJ a 


故可用 


/” （工 o) 




nib — a) 


R n (a ， b) 


作为/(I。）的估计值.如果 /(i) 在 U，6] 上连续，又 b — a 很小，则 

1 

ttT m r r ^ \ /A- .xU rr „\ AA id /m Mr / . J>ti „ 广 z_"l \ 

^ m j n 、工 o ^Tpyy j kjo ) trjjinwTBA 一 w 工乙 ， c ；」 八 

更确切地叙述如 下：设 U “ = 0，1， …， m } 是 m +1 个数: 
— ©©〈 LCrC — S & Coo . 通常假定 t l +1 _ L 三/ 1>0( Z ’ = 0，1， …， 

m _ 1 )- 令 

--- ^ 

r 1 ~ 

丄 ， 

—rRniti ， G +1 ) ，当 ： c 6 (6 ，心+1]，乂 = 0，1广.，/？ 2—1 
f m (± n 

j n ^ } v / 

、、0， 当或 x > t m 


用 /rXd 作为 yxw 的估计 • 这就是直方■图估计法 • v . 

实际使用时，将样本值从小到大排列，得 x (1) < •” 

、 • 

V Tlfr _ 止 I 心 mAf 丄 AA 接 “> / 止 11/ V mh -I— AA» 接心 \Vtr i^T iVn 

⑼ ,s^ a 力和 、 A ⑴ w^^ptrj 似，口力 PL 咐人 ITJ 双 • u% |«J 

Ca ，6 lm 等分.分点 、 





k r* * l-V 435 3fefr .. T^C ^Sfrtrfi U Xfc l、f 「+ + "1 rfe 

于 f 甘八、 h ， h+l 观从乃 h ，江从 *tw 丄 I 卜以 LW ， W+l 」 /V 似 ， KA 

Vi /( nh ) 为高 的长方形（这里 h = ti +\ _ ti = (6 ― a)/m) ， 金一'列矩形 

t 

mr xm 立 

Hl 11 队且刀区 1* tt 思、 


A */ r ^ • A f > \ ^ 邏 ■*■/ J . t ^ w _* 曾 

呆 l 个仗万形的囬釈 




Vi 




7 z+l 


f(yydy 


\ 


在直方图法中 m 的大小没有硬性规定，当样本量 W 小时， m 
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也应小些; 《 大时， m 则大些（比如，72= 100时 m 可取 12) .① 

我们详细叙述下列例子，读者可从中掌握直方图法. 

Ail ji ， 廿 H ta I 一 ^ * /4- 卞 . _^: JUt o c tv Ji 一 o: 山二 d ^4^ / 田 m 

lyij 4 ♦•厶 术鄉 tW J ’ 土 ) — J ~ fc TT 1 W 厶。丄 viii 。 1 ， |±| 丁 ^ TV 1 P 9 ky ^ 

的影响，各炉钢的含 Si 量是有差异的，因而应把含 Si 量 X 看成一 

A MvX- I.k-I A- l=t *Wrt * - — t a -T - > - 上 L Lrm- »— ， j 丨 . • ' — rr- ^ C3 A — » j-、_A 上 L 一 

个腿机父重，规仕有有七的 m 半街皮凼奴定忑仵的？ 

为了确定密度函数，记录了 120炉正常生产的 25 Mn Si 钢的 
含 Si 量的数据(百分数）. 、 


0. 86 

0. 83 

0, 77 

0.81 

0. 81 

0. 80 

6. 79 

.0. 82 

0. 82 

0.81 

0.81 

0. 87 

0.82 

0. 78 

0. 80 

0.81 

0. 87 

0.、81 

0. 77 

0. 78 

0. 77 

0. 78 

0.77 

0. 77 

0. 77 

0. 71 

0. 95 

* 

0. 78 

0. 81 

0. 79 

0. 80 

0. 77 

0. 76 

0. 82 

0. 80 

. 0. 82 

0. 84 

0. 79 

0. 90 

0. 82 

0. 79 

0. 82 

r\ n n 
\J. i ^ 

r\ o 

U. OO 

r\ n /y 

U. / 0 

r\ no 

KJ. i O 

r\ O o 
\J. OO 

r\ n r 
U. / 0 

0. 82 

0. 78 

0. 73 

0.83 

0.81 

0.81 

0. 6'6 

u. »y 

cu 丄 

。•仙 

U. 8Z 

U. 8Z 

n 78 

\y % • vy 

a Ri 

W # X 

n ra 

\y • V-f 丄 

n fu 

\y « w x. 

n Ri 

\y • v-/ 丄 

n Ri 

\y • v-/ 丄 

0. 74 

0. 78 

0. 78 

0. 80 

0. 74 

0. 78 

0. 75 

0. 79 

0. 85 

0. 75 

0. 74 

0. 71 

0. 88 

0. 82 

0. 76 

0.85 

吡 73 

0. 78 


①有人建议采用下列 公式: 


也可按下表选择 m 


m 士 1 + 3. 322Iogio n 


n 

<50 


5 — 6 


r- -l /n y*\ /% *i y-\ 

100 〜 250 7 〜 12 


>250 10 〜 20 
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0. 81 

0. 79 

0. 77 

a . 78 

0.81 

0. 87 

0. 83 

0. 65 

i 

0. 64 

0. 78 

0. 75 

0.82 

0. 80 

0. 80 

f\ 77 

\J, i 9 

0. 81 

0. 75 

0. 83 

0.90 

0. 80 

0.85 

0.81 

0. 77 

0. 78 

r\ n o 

U. OL 

r\ n a 

U . O^r 

r\ n n 

KJ . 00 

* 

r\ n a 

U . 0^： 

r\ n n 

U . OL 

r\ n r 

\J 9 00 

0, 84 

0, 82 

0, 85 

0, 84 

0, 78 

0, 78 


下面对这 120 个数据进行 分组： 

找出它们的最小值为 o . 64, 最大值为 0. 95. 

(2) 取起点 a = 0. 635, 终点 6 = 0. 955, 共分 16 组，组 
距 /i = 0. 02. 

(3) 分组及频数 如下： 


分组 频数 Vi 

0. 635〜 0. 655 2 

U. bbb~U. bYb 0 

A 

0. 675 〜 0. 695 0 

0. 695 〜 0. 715 2 

0. 715—0. 735 2 

0. 735 〜 0. 755 8 

^ 

U . /55 〜 0. 775 13 

0. 775 〜 0 S 795 23 

0.795 〜 0.815 24 

0.815 〜 0.835 21 

0.835 〜 0. 855 14 

0. 855〜 0. 875 6 

0. 875〜 0. 895 2 

0 . 895〜 0. 915 2 

0.915 〜 0.935 ! 0 

0. 935〜 ()• 955 1 


以上用实例介绍了如何分组，下面根据分组情况及其频数来 
作直 方图. 记 ，= v , Az ( z _ = 0， l ，*"， m _ l ). 设横轴： r 表示含 Si 

I 
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童，这里 a = t 0 = 0 , 635 =0. 655， …，〜 =0. 935 ， f 16 =6 = 0. 955， 
t i + l - t { = 0 . 02. 在区间 U ， A +1 ](0«15) 上作高度为 /,// i 的长 
方形，这16个并立的长方形是本例的直方图.注意，第£个长方 
形的高度是 

£ 11 
J i — 丄 丄 _ Vi 

T ~ Vi * 120 * 0 02 271 

为方便起见，取纵坐标的单位是 i + A ， 则直方图中第〗个 

Titl u % 4 ： 

长方形的高度正好是^个单位，见图 1. 



有了直方图，可以看出 X 的密度函数曲线大体是图中曲线的 


a m I I m t 、丄 Pcp -ti_ /*n >?« ca —/ v 上 l t-r-t 

仪直.从团工有，达衆凹珠很诼定止忿 or 仲钳反的凹线.忑忤很 
拒粉抿剌胳 Y 县否服 WITF 本分布呢？鏟汝汶个 IB 1 额的治、法县右 

^ I • • ^ •—I /^#K^ //、 it* 一 ii *， , ■， / u • /^j I y, I 一 " v ^ i ^ 


• • V 詹 i M - 

的，请看弟三草. 

古 -fcrEH 杜 i 、 +66TO^ ： a ： 础且从々 DB9 ^4n~aT IM 4iC HB 口亜 l、51 臨 

_ B * yj Uij IM I M J ku uni AC , I I VCi : TJAj |l 4 Wl - 7 J ? / 、 一5< IRTI 

h 足够小，样本量 w 充分大，则 sup I I 可任意小，这里 

X 

/„( x ) 由 （4.1) 确定.为了确切说明这一点，设 {# M 是直线上的点 

4 

Titl _ ^ An) ^ Art) ^ . 、士 m An) 一 An ) —— L 、^八 / 上 TI 抽 Mfifr L 、 人 

r'J : k Q + l — Lk = R„/UV 一 K ). v 


广/ 、 

In ^ OC ) 



nh 


✓ / ( **、 乂 

■ K”ur an \) 


/ 、 f ■ / /m 、 { M ^ \, 

(a xkzKtr ， Wi 」） 


这里 


t 
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m 


n 


Rn ( tk n ^ ( Xj ) 

«■ ， 1 晨 


定理 4.2。 设 /( v ) 在点 j ： 连续且 ) iml 


= oo 


，则 


n 


n 


对任何 e >0 有 


mix 

n 


P( I fnix) — fix) I ^ e) = 0 


(A 9 、 


证昍.田士 / Y 丨）亦占 T 冻统 . Mr 右 ； r >0 乃 150 .俅对一七 71 

rj - t * / 蟑 • P J ， )■ 1 * J 、、、 A ^ JL ^ 7 « -4 v w — ^ v 7 


: y 6 Dc — 有 f ( y )^ K 0 ^ 

m 本 U Hi ; h /*^S ^CL ( 

认 /t yuyj /V ， l>s. ITT r ^n >X^V./v L>^ fW 丄 、 \ 


俨 ， d 


]. 易知 


P(\fn 


/Y 


、 ^ i CV £ ( 

夕 ty > —j^\j n \^/ 

£ 


( x )) 2 


4 


< 7{ E (/ n (,)- E / w (,)) 


+_ (Ef n 


fix)) 2 } 


(A 9、 


我们指出 


n 


fAx)-Ef n 




nh n 


^ r y a 

/ J w w wx i / 
1 = 1 


这里 


a w (X f *) = I(t ( k n) (D — E( 1(f) ，也 ] (X z )) 

/ 、 八 

Ha n ^ A i ;=u 


E(aAX t )) 2 < 




,/n) 

r JH-l 


in) 


f(y)dy < K 0 h n 


于是 


Er fA ^— EfA ^ y - < 

—^ I_ */"« ' — , - j n 、— ， 2 丨 Z 

72 / l w 


nh n 


另一方面 




故从 (4. 3) 推知 （4. 2) 成立. 


r /' (〜\ — i 


f(y)dy 



oo 


证毕. 


# V ■ . ■ _* 嘗 # # _ # t y V » ^ ^ v - ^ ■ ^ 1 ## A > V # - 

绘辽里涞人的分仇， Bj 以址明（见 L 13」）： 吞密度凼奴/( X )在 
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(一 oo , oo ) 上一致连续， 




x | Y (工) dx < oo ( 对某个占 >0) ，又 


lim h n = 0 ， A „> i(ln w ) 2 ，则 

n n 

P(lim sup I f n ( x ) — fix ) I = 0) = 1 

n x 

这表明 ACr) 有一致强相合性. 

(二）核估计法 

在引进一般的核估计之前，先讲一个特殊情形，以便读者理解核估计的 
思想.设 X 的分布函数和密度函数分别是 PXx ) 和 /( or ). 若 /( i ) 连续，则 A 

很小时有 

»^ 9 ^ 


Fix H - K ) — Fix — h ) 

r\ v 

6 n 


^ fix ) 


而 FU ) 可用经验分布函数(: r ) 来估计，从而可用 


fn ( x ) 


2 h 


[ F n (x + h ) — F n (x — / i )] 


来估计 / U ) ，这叫做 /( x ) 的 Rosenblatt 估计，是 M . Rosenblatt 于 1956 年 

， I 

首先提出夹的.不难看出， 

w v -- v , _ ’ - w w W W ■ ■ , 


n 


（工 ) 


r\ f 

6 nn 




•h * 


( X ,) 


令 


K 0 ( x ) 




兮， x € [— 1 ， 1) 

I ■ * ■ • 

U )， 其他 


则 


n 


fn ( x ) 




綠 M 


a: — A, 

~ h ~ 


即 A (* r ) 可以通过一个“核函数” iLU ) 表达出来. 

定义 4 .2设 KCr ) 是 （一 oo , oo ) 上的非负函数且厂 ！ Or ) dr = l ， 则称 




KU ) 是孩函数.此时称 


n 


f nix ) 


nh 


5>( 


x - X t 
~' h ~ 


(4.4) 


为 /( i ) 的核估计. 


核函数 KCr ) 有很大的选择自由，类型很多，如 
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t y y 、 

八 i Kx) 


K 2 (x) 


K 0 (x)=<, 


— i < x < 

lo , 其他 

1， | x |< 1/2 

0，其他 


e~T 


X 


I 、 


v 27 t 


K 3 (x) 


TTv 


1 + X 2 


K 


x 


2 丌 


sin 


x 


V 


X 

Y 


可以证明，在一定条件下，核估计具有相合性. 

1 

tvb 』 1 ，rL rrp t ，/ \ ^yN* r-t 知 /«L. 

疋 S U 议饺田戮俩疋 求汁： 




(K(x)) 2 dx < oo, lim | x | K (x) =0 

I 工丨 — 


又密度函数 / 在点 x 连续 ，/ 0 且 n / i n — oo ( n — oo ) ， 则对一切 e >0 有 

1 • ✓ /* / 、 /* / 乂 乂 yv 

umr 、 j n Kx) — jkx) ^ t)=y) 


n 


苴由 7 乂 r ) 县 /Y r ) 的炫估 i + 

I •/，*、™ ' I ^ I ， I 


n 


f nix) 




nh 


5>( 


x-X, 


n 


\ h n 


证 明：首 先证明 


limE/ n (x) = fix) 


n 


/=v«*> r^L t 

头师 J1 ， 


Ef n (x) 








JT f ( — f( m^S I 

- ^ J 71 v w x j x w x I 




h ^ K (^^) f ( y)dy 

^ ft 


K(u)f(x — h n u)du 


K(f^r f(T — h 」 j ‘、一 f(r)lAu 

應慕 \ w ， I_ / 、 


^ sup I fix — h n u) — fix) 
I «I OC 1 


+ sup K (M) • 

I«I > 扑； r 1 


fix — h n s)ds 
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(4.5) 



+ I /⑴ I 


m 


u I >Sh 


一 1 


KU)du 


n 


< ■ su^ I fix — y) — fix) I 

j- y I 


■ * 
十 




SUp I I4fi iu) 

u I >Sh 一 1 


n 


I /( 工 ）I 




u 


I >Sh 


,K (u)du (S > 0) 
1 


n 


利用这个不等式，不难看出 （4. 5) 成立. 


现在来证明 


lim Var (/ n (x)) = 0 


n 


实际上， 


Var(/ n (x)) 


n 


Var 


'T 

X — Ai 


h 


n 


K n 






nh n 


K 



x 


h n 


f(y)dy 




I ▼釋 


nh 


n 。 


[fC(tt)] 2 /Xjc — h n u ) &u 




nh n 


[K(u)] 2 I fix — h n u) — fix) I du 


1 


nh 


fix) 


n 




[K(m)] 2 du 


, s y rJ fU - y) - fU)l 






[K(u)] 2 du 


1 


Tih n j 




■ ^ ik ■ 

u I 


_ x lK(u)yf(x-h n u)du 


n 


2 


p 


nh 


fix) 


n 




(K(u)) 2 du 


< o ( l ) + 

rvi 


sup [K(w)] 2 in 


n I U I >sh 


-1 

n 


<o(l) + 


sup [mK (u)] 

n A _i 

，… I « I >Sh " 


(n 


n 


0 ( 1 ) 


(n 


这就证明了 （4. 6) 成立. 


于是 


(4.6) 
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尸 （ 丨 /« (工）一 /( 工 ） t > e ) < — E [/ n ( x ) — /( x )] 

e 

< X {Varr fAx ) - f ( x)TS 

/ x ^ rii ' _ _ ， _ L— j ' _ _ ， ^ w ^ %, 


2 


e 


o(l) 


in 


、 - r- UU. 


经过更深入的分析，可以证明（见 「131): 若密度函数 /(: r ) 在（一〜，〜) 


上一致连续，且 


lim/i 


n 


n 


0, 2 exp {— yrth \} < oo (一切 y>0) 


n 


■ . * 、 i -* ^ ^ > v > # # 

乂孩凼奴是有畀货差的，则 


P(lim sup f n (x) — fix) I = 0 


n x 


R 萆铉涵救诜渴彳舌劣.炫估 i + 徉沣 A 首古囷估 i + 右銥钚的糖 

，、_ 霄 < >^V"v yy ^ > ^4 广 t ，■ • ' |>^\ I i^i 『 I I ■ * . i~~ l ，， 卜 I r—• ， _ ■ ^ n f ， 

度，我们不加证明地指出下列事 买：设 /« u ) 是前面介绍过的 

2 士且一 tVi i*/Jr4+I 、 T?FT Z' 广，、且古 

ixwo^nuiaui I 口 V I V CQ vS 、 ，於疋 — 1 丁 TT7 小 口：； T 么 I 口 k I : / ， l"J J n V 丄 / 疋丘 

方图估计，即 


f 一 ( jo ) 

j rt ' —， 


nh 


RAti n) .ti n 2 ,). ^ (ti n) 咖串 h^O H 

— - ft 、- K ，- Kli, / ■ f -、- K ，- 氏 11 _I,/ ，■^ ■ * r%. ■ ■ ■ 


n 


- ► oo ( n -^ oo ) H ^^ 


E [九 ( x ) —/( x )] 2 = 0( n 


4 


E [_ f n ( x ) — /( x )] 2 = OCn ~ ) 

r « 碥 #rv 丨 ‘ 》' * ▲ v > 身丨 v 丨 # ▲ #_ 4 ^ » r # v —* t # . \ - 、 ■—t 、 >. 

俠句诂 t 兄， Kosenbiatt 恬计比直万囝佰计有衩小的浙近巧万误差. 

(三）最近邻估计法 

设 /(： r ) 是 X 的分布密度，兄，… ，尤 是样本 • 1965年 Lofts - 
garden 和 Quesenberry 提出下列最近邻估计法.选定自然数 
KU ) •令 

£ 

a n ( x ) = min { t ： R n (x — t 9 x t )^ K ( n ) } 


/: (工) 


K (^ 

2na n (x) 


其中 
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— t^X -\~t) = I( ； r](X,) 

i=l * 

是样本落人区间 (x —£，: r +^| 的频数. 

W 人 r* / \ ml LIU r / \ AA B. >d >Mr /- 4 -^_L ' 

込 t/„ r • 

经讨深 人研究，可以证明（见 r 131 ) 下列结论：若 f (： c ) 在 

— - w p , ■•--，— ^ , ▼- ’ 》 - - - ^ ^ —罾 ▼ v ■ v b jT p 

( — oo , oo ) 上一致连续，且 


则 


r Kin) 
lim - 

n n 


= 0 , 




lim 

n 


K(n) 



1LX fi^ 



r>/l: — _I r* / „\ rt 

厂、 mil sup I j n \jli — j \ JLJ 
n x . 

Bn f* 广个 、且 /Y 个、 66 ― .Sfraft te^>fdtn+ 

沁 r j n \丄 / ac. j \^ / J»，| 口口 im y\ • 



1. 设 x 服从几何分布 



pcx = k ) = pa - p) k ~ l , k = i ,2,- 

^， x 2 ，" •，尤 是 x 的简单随机样本,试找出夕的最大似然 估计. 

I 

2.设 X 的分布密摩县 

- w-^ ▼ ， ▼ - _ - _ ■ ■ 


fix ) = 



2(7 


e <j 



(cr> 0) 


兄，&，…， X n 是乂的样本，试求 ( T 的最大似然估计. 

q -Ja- V V … V 且 : sfc 白 「/3 /3 丄 11 P+ti/rt 瓜女 66 进女甘 nb —— a 

山 认 八 1 ，八 2 ， ，八 n 乂 t 小 口 LV ，V 1 丄」 -L. ^ M ">H MV IT 个 ， I ' W 

« 

< + oo . 试证明 0 的最大似然估计不止一个 / 你能求出0的全部最大似然估 

rfna? 输能找屮 ^ 的子偏估 ifts? 

r I v • r*# • i-#w v ^ ^ w rn^p | 卜 h 聲 ■ v • 

4. 设随机变量 X 以均等机会按 N (0，1) 分布取值和按 Nk ,/) 分布取 
值(//， 〆 未知， 一 ooC^rC + ooWlX )). ’这时 X 的分布密度为这两个分布的 

<A?r P*P A/i \IT -Ivh 
lETi 戊 ITJ 丁 H : 


f(x ； fjL9a 2 ) = 





• ( X — pt )2 

e — V 


设 ^ ,X 2 ，-, X n 为此混合分布的简.单随机样本，试证明 x/ 和 a 2 不存在最大 

v 


似然估计. 

5. 在买面包作早点的男、女消费者中，男性购买者的比例/>未知，但知 
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道设在70个购买者中发现纟2个、是男性，58个是女性，求/>的 
最大似然估计. 

如果对/>无限制（0</»<1)，求 ./> 的最大似然估计. 

6. 设不，&，…，尤是来自下列两参数指数分布的 样本： 


f(J0 • ，❻ \ ，沒 2) = ^ 

、0, 


▲ 

—- 

e h 


(：^ ) 


0 i 


jo <C di 


-鳖 i ^ I 、 ^ a. I 、 V MX 童 i 及 —V t ^ \ 、 , _ 

具干的 t Q — oo , 十 oo ), 的 t ㈧ ，十 OO ), 试不出的祁％的取 x 似热伯 TT . 

7. 设兄，^,…，；^是来自下列 Weibull 分布的 样本： 


F ( xta 9 r )) 


1 — e _ (f ) a ， x^O 


(0, 


一 ^ - Y\ 
JL ^ \J 


其中 a >0, 7 >0, 试证明心7?的最大似然估计存在 • 

ft ■? 办 Y. Y. ... V 且 : *1 白 T 方 il r* 公金 的详太 

ui y y 9 ac , ^卜 口 i / y i J4 ^ hj i^t ^~r~ 



/( x ; a ， j 9) 


r ( a ) 


" p 
'>0 , 


V 0 

w ^0^ "w 


x ^ 0 


其中 a >0，#>0, 试证明 a # 的最大似然估计存在. 


9. 设兄，叉 2 ,… ，尤 是来自下列分布密度的 样本: 


f\x 9 0) 


f r ( g + i ) h 

〈 i kuj i viy 

lo , 


0 ^ ^ 

其他 


其中 （ 0,+CX3) ，试用矩法估计久 

« 

10. 设不，不，…， x „ 是来自分布密度为 

f ( x - 9 Cjd ) = 

的总体的样本，一 oo < c < + oo ，0> O , 试用矩法估计(:和夾 

11. 设…，;^为 iV (;/，( j 2 ) 分布的样本，参数 / i ，( T 2 未知（一 oo < 

丄 一 2 A\ 人 

"、丁^"，(7 /\ J } 、飞 


2( 足 -X) 2 


S? 


1 w 

丄 Y (兄一 
n —1H 、 — ‘ 


X ) 
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证明对所有可能的;/和 ( T 2 的值，作为 C 7 2 的估计 ，较 的均方误差比 S ? 的均方 

丨 鲨參 _ ■■ 癱 ■ t m »« m ft a—t __ • 方 I i \ I ■ * O u » * t—1 I . /_v ■ 

误差郁小，即 $ 比 $ 有双；但 n 是尤■估 trira $小炬； m 定取入似热 

估计. 

12. 设 Xi ，不，…， X „ 是来自下列的 r *( a ， j 3) 分布的样本： 

P tt la-1 .-Ojc' _一 

- x e • 9 JL^yj 

f ( x ; a 9 p ) = S r ( a ) 

/\ 一 r\ 

、 U ， 


n n 

兵甲 a > 。，戸 > U 木沖，址明 ( 11 A t , 2 j a « )M^a,{J) 的尤 OT 现 TTK. 

* 4 B _ 

f = 1 t = I * 


13. 设不，&,…， X, 是来自参数为 A 的 Poisson 分布的样本，试证明 X 
和 s 2 二 -^ ry ^ ax ^ xy 都是 A 的无偏估计, 并问： 是否还有其他的无偏 

n _1 f ^ 

估计？ 、 


14. 设兄，不，…，^是来自下列二项分布的 样本： 

. P(X = k ) = Q k m d k (1 — d) m ~ k 9 灸 = 0 ， 1 ， …， m 

试求 # 的无偏估计. 

IK Y , . Y ..— . Y 县本白余掛乇】的 Pn ;« rm 斗右的坦太.钟步 ） 2 

+ V • ^•■Tl T--^4 7 y ^ m n / v * x M v ‘ v V v *» / 嘁 ■ n M V V 1 "I ^ 7 9^H ，V ， 

的无偏估计. 

16 .设 X !, X 2 ,-, X „ 是来自正态总体 N (；/， ct 2 ) 的样本，试证明 



(X t -X) 


是 (7 的无偏估计. 

17. X , .Xo 

—• 一 '^丄，一 _ 厶 


# # _ 


Y _ 县本白 加下浓度的 Parpto 斗布的桂 is ：. 

■ • r 暴 〆"I »-^ 广 I «-k| ^ v • I 'I • 


0 


fU ； d ) 


y 4 I v /I 1 1 9 

u 十 幻… 


lo , 

其中 06(1,+ oo )， 试找出 6 T 1 的无偏佔计. 


0<Cx <+ 


x^O 


18. 设兄，&,… ，尤 是来自下列分布密度的总体的 样本: 


f(x ； 6) 



x^O 

x < C 0 


其中0>0,试找出 0 的无偏估计的方差的尽可能大的下界. 
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19 •设 不 ， X 2 是来自如下密度的 Cauchy 分布的 样本: 


/( 工； 0) 


7t[l + Cx — d) 2 _ 


iB : 由 ( — oo .+ oo ： ^试拇屮 a 的各诖壮昍補 tin 

，、 ■ 一、-、 7 ' W 7 | ^|^Vx«-^r4 V MV 1-1 AK% |P-I r I V ^/U ■/< ，二 t l-^M ， 


20. 设 X 取值 1 或 0, 概率分布如下 


P,(X=x) = 


^(1-0) 


\^x 


■ / -■ x *r 

\ u — C/；*y 


- jr 


当 0 是有理数 

、|>T r\ l=f "r* -m» aIc£* 

彐 c / 足兀埋纸 


其中 0 G ( O , l ),: r = O ，： L 设 &,&,•••,& 是 X 的样本，试找出 0 的最大似然 

广 - # 

I 

4±^+ a ifc^XHH a 丁目古虹 、 
im v\ i/fi，yr u n ， i 、六 b to 口 1 工 . 

21. 设 X , X 2 , … ，又是来自密度为 


* 


的总体的样本 ，一 °°<0< + oo , 试求岀0的最大似然估计么并证明么是强 
相合的. ： I 

22. 设不，乂 2 , …，尤 是参数为 A ( A >0 未知）的 Poisson 分布的样本，证 
明又是 A 的强相合估计. 

9 Q ia * V V ... V 且， n / AI - 6^1+ tt / rt : 八 t 66择女士 a 6 fi W -» HI £ -Sb 

^ j ^2 ，- - 9 八 n 9 i // 丄 J 4 MV T"T f u wj |口 Al 、 I XV 

l - a 的置信 区间. 设得到了 5 个样本值 0. 08,0. 28,0. 53,0. 91,0. 89,求0的 

晉信 7 k 平吩 0. 沾的營信 5 f 面 

-J«- ■»"«, 嘩， | 〆¥ — — 1"> V | p-f «=~ =* _->#■ 

24•设不， X 2 ,… ，尤是 Bernoulli 分布 6( 1，/>)的样本，试根据中心极限 

定理构造 n 值较大时/>的近似 l _ a 置信水平的置信区间. 

1 

25. 设 X 〗， X2 ，…， X ”是 N \ fJLjG 2 ) 的样本，证明样本方差 

飞” _ 

丄 1 /，， 、9 

y =——7 ~ Ar 

n ~ 1 T^i 

的方差为 

Var(S 2 ) = -^-r (n^2) 

n — 1 


26. 设兄，… ，又 独立同分布，共同分布函数是 FU )， X ⑴ 
<兄„)是兄，…， x „ 的次序统计量. 证明： 

(1) 对一切 1<1_</2有 


P(X (t) ^ x) = 


n\ 


ii — 1) ! (n _ i) ! 


-cv 


0 


x> 


u 


t —1 


(1 _ m)"~* du 


(2) 若 FU ) 是连续函数，则 
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E[F(X (() )] 




. ; Var[F(X<o)] 


— ’ - z ( n + 1 — O 

、 y — I i \ 2 / ^ I o \ 
z _r 丄 / \n -r l) 


27. 用放射性同位素法可以客观地测定地层的年代.为了研究这种方 

的难 施由 HISI — «1巨而了 10木详饷 I 空了生描初苗仿.石 

lit wv y 乃 j i-j >ia / 办 4 丄以 i ， i 丁？ itcj au- j ~i~ i v y va i \ -|— i-^- i h /v 


年）： 

249 254 243 268 253 269 287 241 273 306 303 


八 rt 内八 rt 产八 n r\ a m rx ^n. j i"\ r\ r\. ^ r\ 

ZiSU ZOU 乙 Db Z/tS ^44 61S6 3 丄 U 

假设这些数据是正态分布的样本，求方差 tr 2 的茸信水平为 0. 95的置信区间 

1 和士二也丧 - iVi @ ^ a nc 沾租佐 

TH^rms q 卩 y 息 I 自小丁乃 i7o 卩 y 且 

■ * 

28. 科学中的伟大_现往往是由 It 较年轻的人提出的.下表是16世纪 
中叶到20世纪的12个 i 大科学突破的 情况： 


料字友现 

vk# - ^ - 

料字豕 

牛份 

M—m. 山蠢 

牛酹 

日心说 

哥白尼 

1543 

40 

，二 TT m -iV A At 甘 一 Jp* r^t 4 =U 

至处現汉入入子平疋评 

/4n n/tr 

W 們 . 

1 iyr \/\ 
XV \ J\J 

a n 
吒 0 

动力学、万有引力、微积分 

牛顿 

1665 

23 

电的实质 

富兰克林 

•1746 

40 

k A 血 __ a. _ _ A A. m. 

燃烧即氧化 

■ k i i ‘ 

拉瓦锡 

1774 

31 

地球的演变 

莱尔， 

1830 

33 . 

%XL /I* 、人 

、 t - 及匯 • \ ■ 

込小乂 

-% r\ ^ r\ 

丄 QDO 

j r\ 

4 y 

光的电磁场特悻 

麦克斯韦 

1864 

33 

放射性 

居里 

1896 

34 

量子力学 

普朗克 

1901 

43 

狭义相对论 

爱因斯坦 

1905 

26 

p wk # w # wk # ■ •- _*^ 詹1 

重于刀字的奴字碁础 

晬疋谔 

丄似 

39 

设提出重大科学发现时科学家的年龄服从 ) 分布 （ ii ，( T 2 

- •- — - - - - » - - • - 0 - • ^ 

未知），构造 


的置信水平为 0. 95的置信 区间. 
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第三章假设检验 


§1问题的提法 

上一章我们介结了估计的方法,但在实践中还有许多重要问 
题与估计问题的提法不同，也需要我们去解决.请看下列简单的 
例子. 、 

TEil 1 廿 1^441> -tV Ct -44 - C\r\r\ I$U /rt -kAs. 7T 人人 —J- r h 

m 1.1 禾 j 书一 tra 厂 po ，： ^ ]卞，夕災赶 m 题百怕 o mm 

厂，按国家标准，次品率不得超过3%.今在其中任意抽取了 10 

/土 / 丨、 - -v+rt 、 、 . -i 八 /*!_ ^ 1 - 八 / * 1 . 、‘丨 i I—t , 、一 * 、 _S_t r t r ■ i—t 廬 矗 • r . i — » 一 

什，及现达 iu 忏甲书 z 忏定仄疝. N 这孤 广疝能伢 au ? 

U 吉观 h 砉.砬柑卢品县不能屮厂的.伯铟 由細 女？ 

， / 、 I~l. r F=l 7 4 KW / MM ^ I r^U U-I / M v 7 |J_^ ^-sn 卜 n 「 g 卜丄 ^ • 

设这批产品的次品率是 p ， 问题转 化为： 如何根据抽样的结果 
来判断成立与否？ 

例 1.2 用某仪器间接测量温度，重复测量5次，所得数据 (° C ) 
是1 250,1 265,1 260,1 275,1 245,而用别的办法测得精确温度是 

1 277( 可看作温度的真值），问此仪器间接测量有无系统偏差？ 

tn t>t /Jx r=S^ ter 、 - x* 人 /), cm >in*i At=t 上 x* .m=i /±r 、 f/ Ml 、 - x* i=i 人 丄 " 

用 a 衣用込 tix 斯侧恃 mi m 反但，彐热込定一 t warn 戈: 

量，得到的 5 个数据是 X 的一个样本.问题 化为： 如何判断等式 

K ^ mm mm •• - 會、- 、 歎 ▲ ■ ■. 

"iiA = I Z 77" 现立与古？ 

例 1.3 在针织品的漂白工艺过程冲，要考察温度对针织品 
断裂强力（主要质量指标）的影响.为了比较70 °(：与80 ° C 的影响 
有无差别.在这两个温度下，分别重复作了 8次试验，得数据 
如下： 

70 。(：时 的强力 ： 20. 5,18. 8,19. 8,20.9,21.5,19.5,21. 0,21.2 
80 °(：时的强力 ：17. 7,20. 3,20. 0,18. 8,19. 0,20. 1,20. 2,19. 1 
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究竟 70 ° C 时的强力与 80 °(：时的强力有没有差别？用 X 表示 
70 ° C 时的强力， Y 表示80 1时的强力，问题变 成：如 何判断 X 与 

V 盘术货 11 l=UM 
i 疋口选 >9 〜 i h ji 十 py yj 叩： 

例 1.4 为研究抽烟与慢性支气管炎是否有关，调查了 n 个 

• I‘ m» t=t -T* 1 L Lm I 一 ^ t=t -T* tfa / XEd X#K —1^ jL ^ 、 T^rr -rM \f 二 l * z r.l 

人，奴畑仪职定哲畑烟勺定货思两 U 受征又 ' W 灭 ^JTU ("囬 

2 X 2^ ^ 



有病 

无病 

1_ t _ IJnr* 

mm 

nil 

tin 

不柚悃 

» r 

〆 

7lo\ 

t 

Tloo 

^ A# 


n . 芒柚悃 n. 芒右病 

舍 X = 厂 ^…… y = 厂 "， T … 

(0 , 若不抽烟’ 丨0，若无病 

rvnsff 仆斗*||激；“丫 t ； v 士 btt 础六，，且不赤六 

i^i AC 2 i ru y~^ ^p\ 八 —y 丄 ，^口 只 〜」^. 

" ，例 l . s 怎样根据一个随机变量的样本值，判断该随机变量 
4 否服从正态分布 nc ^,( t 2 )? 

更一般地，如何根据样本去判断随机变量以给定的函数 
尸。（1)为其分布函数？ 

这些例子所代表的问题是很广泛的.其共同点是从样本值出 
发去判断关于总体分布的一个“看法”是否成立•，例 1. 1 .的看法是 

U m T^rt ^ ^ A r\ M /rr.l -i t=^ U T"» ' 尸 -i ^\n ry 99 1 o /*l* ~=^. P4 ii T7" I^ 

，仇而半 UCT ，例丄 •乙定 = 1 H l y ^\ 6 即有拔定 A 勺 

t * 

、 蠡 

Y 右相固的公布”.械 1.4 的羞法县“ X 扫 Y 相百轴立”.你 I 1. 5 0 H 

™ j -4 ' ■ i^f I -# ^ y ,r^ 1 -4 ~ " — f-» ^ t—t <4—^ - v ~ f •-• ■ •• 4 k 嘁 , ，方 

^ m h _* _ ■ m. 

是 “X 的分布函数是 FoU)”. 

“^>K”t 7 niliWr “ 胞瓜 ” 

泪仏入 m ibcw. • 


这些就是所谓假设检验问题(或叫假设的鉴定问题). 

. 本章介绍假设检验的基本理论知识和一些常用的检验方法， 

剌断所羊;|\、的“低沿”县否成古. 

/< <4 »-*r I ,，■一^、 w »-• il^v •-— > rvH ~ M. * • 

I 

例 1. 1、例 1. 2 和例 1. 5中“假设”都是关于一个随机变量的 
分布的判断，这叫做一个总体的检验问题，例 1. 3和例 1. 4的“假 
设”是关于两个随机变量的分布的判断，这叫做二总体的检验问 
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题.也可以考虑三个或更多个总体的检验问题. 


我扪主要论述单总体的检验问题.把我们要检验的“假设” 

々口此 117 广 :: B 咎 mJ/ifr 牵庇 1 、邙 、 HT 且 ^ imiCfeift 你县 / 衽 / 女、 66 瓜： fe 
I r no v^ci rp \hk^t iix 认 / ， no 疋入 j wi/u 义里 v 心 w;i 乂 i 

的一个“看法”.说得更确切些，设 X 的分布函数为 FCrW )， 其中 

n S : n /r\ 、 tV m /r\ . 曰 人 m A-rt 入 / 曰 4^r 佐 人 -=1^ tin . 后 . LQ rrfv -V 生 

(7 /» 丁 cy ，込壬 tv 疋一： 「 CiTW 朱百 v 疋大双朱百，现 PJ 里组肌心朱 

合，也可以是更一般的符号组成之集合）.零假设通常可以 

w ▼ - — — ^ ■ 一 ■ f -^r ▼ ， ， • r r ^ ■ -^r ,~—^ ’ ■ — -—- v ■ t — — 

表示成这样的形式 dea ， 这里 a 是 @ 之非空真子集.通常把 


“/9 f 仰一亂 ” uil 撒讨古假份 r 武 nil 么埋假份 ）. iP 你 H H , 

v 、 y I irw , r i * il^v 、 -5=^4 ' I r=i g^r~ iuv , 7 rw ii * - a - 5 ^ ■ ■ 1 ■ 

怎样根据样本值对 H 。 进行检验呢？这就需要对“检验法”给 
出合理的定义.直观上说，所谓一个检验.法，就是给出一个规则， 
对给定的样本 A ，…，进行明确表 态：接 受假设 H 。 还是拒绝 

-t 

r 

im ur ( V ) 

IKfeX J ^ o w * 

用数学语言可以说得更清楚些，设 s 是所有可能的样本值 

« 〆 

, '■: ■ ： 

， 、/ mn >■»■»、； A»-t - tv 上 l 八 / »-va t - 一 ^ •>—I x trr^ 、 a* A XA. •=* 人 x-L. 丄 I、- 

、々，••• ，: c „ 八 w 回疋）组 jj 乂的果甘（忤夺仝冋），所谓一 T 恆遯汰柳 

* 

县指吞间 S 的一个创斗 . 丨 I （又扫 义不 相夺 V 坐 

■# h —■— I 豸 — "Y | w /v • — I 一 l \ —jl v —厶 » ， • -1 

« • 

U ，…，& ) e &时接受瘕设 h 。 ；当（:^，… , xjes 2 时拒绝仏， 

t ■* 

^ q nil 述 iMr 姑 C ： mJ 不由七忠 R 3 斗 C = C — Q : tfr 口萌细4首7不 

入 2 *^1 J 又 ，*^2 口 I^SJ，y ^ U2 ，从 / 、 3«T >ah Jk& J 口 

定域，就知 k 了检 _ 法.每个检验法对应一个否 定域； 反之，任给 
定 s 的一+子集 w '， 则 弯一个 ka 法以齿作为它的否定 ’域. 故研 
究检验法就相 当于研 究否定域. W 便于数学处理，通常要求否定 

- I 1 

㈡ JJ1L. iX* •V"Tl 广《 -i_ JaL^ 1 r-\ ^ 上 L 1 【二 ^ 一、山 

观定忏平仝冋 ：> T 的 norei 果. 3 屮的 Dorei 果 a 步 j ，九見 M 逃 

哪一个对检验 H 。 是最合适的呢？这就涉及检验法优良性的标 

^ v #> t t ^ V *■ _ ft ■ • -*■ * * w - 參 m _ M - . 1 _ _ j % ^ 

准•为 r 分析这一问题，我 in 看看在取足二个否足域 w (即选足一 

小檢路吐、白右斗力 白里’ • 

I / /M y n 雇 I /M XT's.. 

零假设仏在客 观上只 有两种可能 性：* 、假.样本值 

f 一 … — \ J^t n -tt 7m ^r4t TTT 他 ,k4 - @ 工 -jFZ 4cfe Jir TT S 工 TIT zifc Tp. 

V^I 1 ^nJML7\^H m TV H J B 匕 T 土 ： /» J ^ ^、/|、/« J w • 石不 


i • ■< 

①本章只研究 这輛固 定样本量的检验法.至于样本量木_定的飧况，现代也有 
大量研究，归嫵于数理统计李的一个分支——序贯分析 ，见窠 六章. 
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用 W 作否定域，则在观察到样本值 (^ ，…, x„) 时只可能有下列四 
种 情况： 

LJ 古 TK? / 〜 …〜 、商工 

V JL/ 110 共 ， IHJ VU.1 ^ - - 9 JL n /jm 4 t 

(2) Ho 真，而 U " …，不属于 W; 

. l: i ✓ 作、 t t /m - g .* / \ —r* TTr 

K 6) n 0 假， [TIU：^ ，…， U 属丁 W ; ， 

( A ^ R . 假.而 fT … ••••T」 不匿平 W 

、 ▲ / ▲ ▲ U |L>^ 7 |B«4 X 丄 7 7 fl X I /r-*H V r F • 

根据我们的规则，在情形 ‘(1) 应拒绝 H。， 在情形 （2) 应接受 

LJ 介磁 : IK /。、 士忙泌 LJ Vr 磁加 / >1 、士杜龙 U 娃 JK/O 、 / o \ 1U 

■ 

然好，对的表态与客观实际相符.但（1)、（4)两种情形下，表 

，， V ^ w — 罗 一 "- *^F- V 零 »• "W T r * ▼ *W V - - — » ， T f ，-， V ■»• 

态犯了 错误: 与客观实际不 符，. 在情形XI)下出现的错误是把本来 

真实的看法 H。 进行了否定，这种“以真为假”的错误叫做第一类 

* * 

错误.在情形 （4) 下出现的错误是把本来虚假的看法 H d 接受下 
来，这种“以假为真”的错误叫做第二类错误.由于样本值有随机 

S 

性，这两类错误一般难以避免. . 

44A Ht: ~tT. B 4^ -Jr- V V A A* /dr —T* U I -irrt vo 人 AA 

， 汗平但 工1 ，… 9 x n 定汗平 Ai ，… ,A„ tr、J 但，仕1、，|胚诉云 

情况下，同一个字母有时丟示随机夺量，有时丟示随机夺量的侑， 

_ ,， f ， w" ^ r ^ ^ ■ 〆' — ■' a , i ^ ^ ^ r ^ ^ 1 . »- ▼ ▼ , 

V 、_ t I W ■ T • 、 - — ■ * A. I •一 、■^ I A 1 ^ >* ■ f* - ^ ▲ ■■ ■■_ >l>_ *- «j- 、■^ I —■ I W i.1. I»M* 入 

这从上卜又有 小 会弓 I 起误会.刀 J 饼艽网关裙误，51近1些概： 
知铪县 

， I n 丨 V • 

：" 用 P(A W) 表示X的分布的“参数”的真值是0时事件 A 发生 
的概率(或用记号 P^(A)). 

■ rl * 

' r / n\ ^ n / -Wir t?? t t I /i\ 

^ wKU )= rK ^^： n 0 \ o ； 

= P (( X l r -, X n )^ W \ d ) 

、 /0 w ((9)=P(fMi6 H 0 I d ) 

t ^ w 

* 

= pax l 9 - f x n ) ew \ e ) 

L w (<9) 叫做检验法（否定域）的操作特性函数(简称 OC 函数）， 


咖⑻叫做 W 的功效 函数. 显然 JV ⑼ =1— ~ ⑼. 

当 (9 G 0。 时，~((9)表示犯第一类错误的概率.当 (96 0 。时， 

*. 

V __ 、•身 # - ■丨- 、# # t M » a ^* •- 身 _ 、 V •、身 • , 

1一~(60表 7 K 犯弟二突铕误的概率.戎 II 』目然希里远取这枰的否 
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定域，它犯两类错误的概率都很小.换言之，我们要求功效函数 
〜（仍当(960。时很小，当(960。•时很大. 

遗憾的是，对给定的样本量 n 来讲，一般而论，第一类错误的 
概率小时，第二类错误的概率就大，反之亦然.因而不能做到两类 
错误的概率都任意小.所以问题的正确提法是:应选 W 使两类错 
误的概率都尽可能的小. 

通常称 sup &(<9) 为 W 的检验水平①（也称显著性水平简称水 

■rrt x - * - j 、 赢 tt—• —. t . t.>-» . t k * 、一 • m . 一 i / a a \ ^ 上 l t —^ 山 "rt— 

干入仕头师:丄忭甲芾芾这怦捤出叫 越：对菹疋的 小止奴 ( K 通芾取 
^=o lo.o of ; o omnlsru 給胳 7 k : 取7；紹计。 的跖右 否帘诚 

m ^ m —.w 7 wr. ww v • v x 7 ^sr-t )' g // 、 ■ 二 a* 、 I r I /VB- 乂 1 认 "V //I l -4 卜 -• /■>**■ 

中选取犯第二类错误的概率尽可能小的否定域？ 

我们常把要考虑的检验问题用下列符号表示 

H 0 ： i 9 6 @o ^ H a ： <9 G ®i 

这里 h 。 是待检验的“假设 ”, H a 是备择假设与 a 不相交.在 
很多情形下，@1 =0 — 00. 

\\M , , TTr S 4-A^ 7 ? 人 一 b TIT *7^ 曰 I - -r^ 士 t A At -3CT 

疋乂 i . i 孙 w 定恨题小卞力 a 叼一双取人切双 ITJlif 疋概 

(简称 UMP 否宙城），若 W 的 7 k 平为 a 而日对一切 7 k 平不轺1寸 a 

■ 'W w 'W ^ ， , W ^ ， ▼ I 〆 , - •， ^ , , r —- 

上 L jI i 4 

的哲疋墚 w ig 令 

n ^( R ^) r —— 七 n 純、 

t^y\/ ' v / ^0^ A-^Ttr 、 v / ' W v1 , 

能找出一致最大功效的否定域当然好，可惜这种否定域难得 
存在.比“一致最大功效”较弱的要求是“一致最大功效无偏” • • 
定义 1 .2 称 W 是检验水平为 a 的无偏否定域，若对一切 
沒，有 

p w ( d )^ a 

子偏株县相白钬的萆龙.“假沿”龙亡首兜时漕拓雔的概銮不 

，« ki»v I— 1 I ~ I v、、、" 一 ^Si 『 j 、 • il^v ^ ” v ir^w i I 

大于它虚假时遭拒绝的概率. 


①有时称 sup ~ (仍为 W 的精确检验水平.给定正数 a (0< a < l ), 精确检验水 

吒 0 0 - 

羊恰为 a 的否定域^^不一定存在.当 W 的精确检验水平不超过 a 时，有时也说 W 的 
检验水平是 a . 
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定义 1.3 称 W 是水平为^的一致最大功效无偏否定域，若 
W 是水平为《的无偏否定域，而且对任何水平为《的无偏否定域 
兩恒有 

p w ^)^ pw ^> (一切 

以后将会看到，大量常用的否定域是一致最大功效无偏的 


(UMPU). 

在以上定义里“否定域”一词均可用“检验法”或“检验”代替. 


j 1* 董、 I -Aa/ . ✓ I —>.f . ■ * /j-^ v 上 麗 ■ j I • I — Ik y K A -r» A 、， j ■ 、 

寻找一现敢 X 功双（现一轶最 X 切双％调）的哲疋颯（恆 軀抜） 

是相当复杂的问题，需要对零假设 H 。 的具体结构及总体 X 的概 

^ - • • M ^ • _ — 泰 W 参 ▲- • A - A _ a. A A * t. * Ai * _ ^ ^ ■. ^ 

率性质进行具体分析.在许多情形下已有很好的答栗，还有许多 

結泌出土 nt 命洁驻治從安丈被 >4 s A 嫌咅 LI S 9 5 & An 7^ 一 此舌 

ir w ihj /| 、 h/i yuiF3 ： ^rc ， i ，取 < y vir^i • jy、^ ^ n j /vj 

要的特殊情形进行讨论.为了叙述明确起见，在一些定理的叙述 

1 

山仏加也陆+口 命且日」士姑 拍 1 AAt 法二丁 必 71^ ：STT iI4^. <±t iffl A/i4=bJ/^TTT 

下 HiR/twamix: 里疋迁铁生 trj ，跃书 un ，込兰 /t 牲口 y 扣 hs h j 

推广至离散型随机变量,证明方法基本不变，只需将积分号换成求 
和号. * 


作为本节的结尾，我们指出假设检验的接受域与置信区间有 

I 癫 VI—♦ t # » - 、M 奢， r # #1 , i ^ %|> / / 在、 歲 ■—t ■ ^ t. /、 

一柙间早而涞剡的联糸.坟 A 的分布凼数是 Kx ， CO ， 0 是禾知参 

数，$=(不，…， X „) 是 X 的样本.考虑检验 问题： 

I 

Ho id = do <r ~ > H 1 ld \ do 


设 A ((9。） 是 H 。 的接受域(检验水平不超过 a )， 即当且仅当样 

本 X 的倌属干 A (仏）时接等假设 H 。， 且 

■ - ▼ 9 ， tr -^- w ■ ■ ■ 

P ( XaA ( f ),) f ),) C fy 

~ x 、— — — 、 v \j ， w \j ， 

>A. 0 ,( Y\ = If) ‘ A(^ \ . lilll7 士 ——七 T1 /5 右 

^ ^ v / k v i j xi j VV v n 

% 

iDra cvv ' lm'i _ 

-t vi/ ^ / I i/y u 

T 

由此可见，如果 s ( x ) 是区间，则它就是 (9 的置信水平为1一《 
的置信区间. ： 

^*■1 鳕 ， > rL ，尸 ik r y r\ o 广 / 、，尸 _ / ^kt 丨尸 、 M 

m i*o 议 a 〜 m (/， u ，把 、— ⑺， 00 入 4 = ⑼，…， 、 a „; 定 
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X 的样本.对于检验 问题: 


、 d = do ^ e^do 

ITT SR 田你 

" J 小川汉 又取： 

A(d 0 ) = {(xi ,••• fX tl ) : I x — 6 o\^ c} 

n 

其中 y^x t ，c 满足 

n 

% 

P ( XeA ( do )\ do)=a 




"Tt 八 I ▲ TTT 、 

定极軀承干入 


ca 匕一 1 / d 丄一 ■ ■ ■ 离 ■ • / 1 £■ * 1L 

芴知定怀准止念甘仲的 




a 


分位 数). 不难看出，3(在）={(9 : $6八（(9)} = {〜|又一(9|<4 = 


[又_0叉+〔]，这里又=丄这表明 [X — C ，X + C ] 是沒的 

72 ^ 

1 — «水平置信民间. 

以后将看到，在许多具体的假设检验问题中常可选取具有某 


押优艮饪的按受頌，囚_根据接受域构适的置信也有兵优艮 

夕々卜 


st o vr _ d 31 XR Tt 你 給路吐 

S ^ rM — JT 71 f & 

我们首先考虑最简单的情形.设 X〜 F(x，d)，d€： & = 

{0、爪 ue ' 与队） ，设 x 县连绽铟贿机夺量，密度函数是 fix ,-6) 

(对离散型随机变量可进行类似的讨论 ）. ®o = {(9 i }. 检验问 
题是： 


Ho : d = d\ 4r ^ H a : 6 = 02 

V iVt 秘士曰 V …V rJr / F ? 说 xfe er 且士7 iVt 术 nR o 

叹八口 ’JT 十千疋八 1 ，…，八 rt ， /1! L 心什柳 /t 取 XT 口 ’J 口 切7。 ： VL 

k n v 

x=(xi , ••• 9 x n ) , dx =dxidx 2 999 dx n 9 I>( 乏，沒)=丄丄 /(x t 9 d). 

i=i 

定理 2. KNeyman - Pearson 引理）给定 (0，1)，设 
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= { 是 ： Z>( 是，沒 2 ) XoLC^ydi ) } 


(这里 Ao >0) 适合 


( 2 . 1 ) 




w 0 。 




r / /I \ J _ 

l^kx^Oi ja JOr=a 


# ■舅 ^ M % 

KL •⑺ 


则对任何否定域 WC 1 R % 只要，（仏）<心就一定有 

pw 0 ( ^2 ) ^ pw (乐） 

-kiL Trr B tzn -^=r -l-A. 7t/^ JL^ \IT tT -fen 4 A At -^c i-K-i Yri Asflr ― ■* 

伏 RJ W W，W o 疋汐|书做视小丁 1 、姐 Xi CT 疋切 T<3 匕用一天 

错误的概率最小的一个. 

w 『 v ， w ■ ， r ■ , 

证 明：设 w 是任何满足~(氏 ）<« 的否定域，则 

PW 0 (^2 ) — PW (沒2 ) 

=pax 19 -,x n )ew 0 \e 2 )-pax 19 - 9 x n ) ew \ e 2 ) 

\L(x 9 d 2 )djo— (*_ … [*L ( 泛，沒 2 )d 泛 

I J W J 


參## 


■ 齡 ■ « 

^0 J 


m 

• 參 # 

L ( r .A ) d r — 

r* /• 

— 參 ## 

J w 0 -w . 

J w - w 0 . 

r- r 

r 

r 


L ( x 9 d 2 )dx 


>A 


0 


^0~ w 


L ( xfd \ )d x 


w-w 


0 




LCx^di )d x 


A 


0 


L 。 




L { x ^ d \ )d x — … 

T 篁 , I 

J W J 




A 0 [a — )] ^ 0 


证毕. 


定理 2. 1 乃是统计学中著名的 N - P 引理，它断言否定域 

/ o 1 、日 ~tr _& uu / xn Asflr —- 41^ Mfe j 口 >4/i 4ar 士 丄、 w 人太 Jcfe i=rt 士 

、厶 • 丄 7 共句取 VU ： =t、<3 匕币 一 天爾沃 UV 佩芊取 /J 、 八 疋取 Hj 衣 

示为： 


0 = { 泛:又〉又 0 } ( 2 . 3 ) 

其中叫做似然比.这个否定域确定 
的检验法叫做似然比检验法.满足 （2.2) 的、是否存在呢？当似 
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然比 A (各)的分布函数连续时,不难看出确有 A 。 满足 (2. 2) .① 
N - P 引理告诉我们，似然比检验法具有最优性.自然 问：是 

太 rr 士口 ll 从込私斗 ^ /iW 4^ IV^n /V -t±r tm O 1 从 27T 口口 

刀 _ 」口口恤视広 做独 広一汗 VL . r ： 7Tiyi/t 理厶 • 丄 CTJUI：% 

过程不难得到下列唯一性结论. 

tCB 為 為 、rL H ,1 -A— jrtr^ t=t 广 / o 、 / • _ -i r\ x 'r 上 A* — V 么 k /dfcr 

疋理 L . L 议 A 的欠 r 仲街皮定 / UC，tUU = 丄，乙 ；， A m Mj 目 B 但 

隹会 3C= l.r . f(.T.f),)">0\^i i 干 h X (.r/) = L( /LCj ：.^ ) 

^ % ^ p I 一 • 、 • j ' v 2 , ， ^ ^ ^ ^ '^ k • ，、 ' ， - ' ，'^ “，， ' / s ^ ▲广 

)， 设^=(不，…，足）是 X 的样本，若 A ( x ) 在 A 下的分布 

•TS 曰 t^ A/t Vitil /f hzt 广/八 i \ ~i=^ -^r* 、 c\ jhh 《曰 JIT —— 

幽双疋迁决 ETJ ，只 _J A、J 1 工 1HJ a CU ，丄 V ， <rr 狂八 o / ^ ， 13C 1 寸 HO — 

{ x : A ( x )> AJ 是水平为 a 的唯一最女功效的否定域.这里“唯一” 

^N/ ~ ^ ，严 ^ -• ^ ^ ^ ^ -- —— 


① 当 ; 1($) 的分布函数不连续，尤其 X 本身就是离散型随机变量时，可能不存 
在这样的 A 0 . 

例如， X 的分布密度为 


/( x ,0 i )=< 


，当 xe[o,i]. 


，当： r6(l 


/( 工， 02) 




lo, 其他 . 

2 j»— f~ a ■• ^ 

了， 彐 xtL 。， 丄」， 

1 、 f ，_ ' n~l 

_ J "， 3 V 丄，乙」， 

lo, 其他 . 


若样本量 n=l ， 则似然比为 


A(X) 


r 


当 xe[o ， i ]， 
当 xe(i,2], 


L 任意值，其他 . 


干县对仵何 ; U>0 

-W ^ - ▼ ■ 甲 W ^ - — W 


/ 


f(x 9 di )dx = 


{JiA(x)>A / 


0, 当 A 0 >2 


坐 ： u 

,、V X- 


1 

丄 , 二 4 八 0 




1 m • _■ 遍 fc - - - ‘ ‘ . 

口 J 见 ■ 时 没有； U 满足 C2.2). 
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的含义是:若 W 也是水平为 a 的最大功效的否定域，则 ^( WAWo ) 


d 


= 0(" 是 Lebesgue 测度， WAW 。 =( W ~ W 0 )(J ( W 0 ~ W )). 

证明： 由干； l ( X ) 的分布函数连续，故有 L >0, 他得 

— ，7 — W ， 'W ，習 - ， 9 • ^ -- ▼ ^ r ， - - V '»■ ， ▼ 

PM ( I /)_ 、=办 

i V A V ^ ，八 0 I / U 

—r- t=t xt t- il I * ttt i=j 、 rr ttt- t=t r^r-n JLt* /-*• _LA. Tt 八 _l* ttT —4*rf 、•- 

丁定 Wo H ^ TN 于走 a •议 vy 定 HJ 1 士一丁果，恆贩 7 Kt 个姐 ; a a 
刖 p ( Y (^ w \ n . aw^^>o 

*^r i \ ▼ ▼ I v i / j 〜 li 4 /|、 >/g • >t—I 卜 \ ▼ i i ” u / ， w rj 


p ( xewd (9 2 ) > p ( xew |<9 2 ) 


(2.4) 


实际上 


P ( XeW 0 |(9 2 )- P ( X 6 W |^ 2 ) 




- ^0 


L(x )dx 






/ X 


L 、 x ，( h )(^ 


w 








L ( x^ 2 )dx 






w-w 


L(x 9 d 2 )dx 


0 




汶 M 乃下而筇们栢田 

― i II ^ f 1^ 


%3 




I >4 f—■ 










斗而轴愔况 Ui 令 


■ i 息 

r ^ r v 


(-) n ( W 0 - W )>0 

此时在集合 W 上 L ($， 乐） > AoL ($， 久） 于是 




J 


L(x,d 2 )dx>Xo 


0 


w 


w 0 -w 


( jc ， 沒 i ) djc 

〜 _ 〜 


但在 W — W 。 上 L ( x , d 2 )< XoL ( x 9 d l ) ，故 

PixewAe.) - Pixew\d,) 

V ■ M ■— ■ 


>A 


0 


r 


L(x 9 d\)dx — I L(x fd\)dx 

W^-W 〜 〜 J w-w, 〜 〜 


0 


0 


XoiPix^Woid^) -P(xew\di)j ^o 


故 （2. 4) 式成立. 
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(二）終 ( w - w 0 )>o 

令 

D= {xxx G ST" »L(x,^ 2 ) = XoL{x,d\)} 

因为 A ($) 的分布函数连续，故尸($占1)| 仏 ）=0,即 


但 h (是，洗）〉0,故 juCD ) = 0. 从而 


0 


r 


W-W 


L ( x , d 2 )dx 


0 


J 




W ~( W q \ JD ) 


L ( x 9 d 2 )dx 


< X 0 L ( x ^ di)dx 

J W - W 0 


由此不难推知 a 4) 仍然成立. 

/. 、 i 、卞 _Li< • V ■ t 、上 Avl t XIs^ Tt 人 AuU 、卞 1=1 ~r*- AA» 

双 1 U 3 U 馆 m ，工比 i 以热 m 恨诞拔 Hi 定兀綱 try . 

定理 2. 3 在定理 2.1 的假定下 


证毕. 


pw 0 ( ^2 ) ^ct — pW Q (汐 1 ) 


证 明：记 = p — W 。， 则 


(* 


nw ( Bo ) — 


0 


a 


w 


L(x,d 2 )dx-a 


0 


r 


w 


0 


I 

(1 — a)L(x, 62 )dx — a\ L(x^d2)dx 

J 


^ Ao (1 — a) 


J 




L(x 9 di)dx — aX 


o 


0 




■ __l 

w 


c 

0 


LCxfdi )dx 


L ( x 9 6 i )dx — a 

=A 0 (a — a) =0 

证毕 • 

视 邀伽谥 昍加钮命田 N - P 引捆 

f/u —f— W ^ r -4 /_!■!* /■-#*， * V I ，一 V* • 

例 2.1 设 X 〜 N ( fi ， l )， jut €:& = {0,2} ，检验问题是： 

H 0 ifi = 0^H a ：fi = 2 

给定 《=0. 05,设样本是；^，…，我们来求出最大功效的否 

» 
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定域. 


X的密度函数是 

/( 工，"） 




\/27T 


/ 1 

exp ( — ^-{x — fi ) 


根据 N - P 引理只须找 { (〜，…, 


A>A。} 型的否定域，其中 


n 


易知 A 




2nX~2n 


■ ■ W ■ ■ > W 

= 丄丄 /(; ， ^/1 丄 /(; ， 0) 

-4-» ~ r 、、、 ， 1 、 人依口 rt 你 V 、 

,yv J A^AO § X^ m±± 7 \ / % JK 八 / 


In A. 

2 n 


i 、 

in a , 


+ 1, 故应选 C 满足 P(X>C|0)=0.05, 这里 X 


1 ，记 c 




iVfo , 丄八当 "= 0 时），于是 


ftX 〜 iV(0”l) 


所以 c 应满足 






\/2 n 


e -f/ d3； = 0. 05 


査表知 \fnC = 1. 65^ C 


i a c 

丄 . \JO 

4 n 


，最大功效的否定域是^^ 


卜 1 〜 ”” ； H ， 其中； = 士 


n 


VjCv . 抆个否穿城县由统 

y' j * - p ， - ' p ， _ ， 


J 丄且 "v r/f> AM Iw cn 你主 zni 去 々廿 /山 A/t /ra J 几 4A , 私 i、:n 山山 

H 里 a 不洲 /tn kA/ 口付到，狂 KT 夕升 TltttrjlRK 恤逝 l w J 趙 T*TJi 

有类似情况，优良的否定域往往可以利用直观意义很清楚的统计 

I. la* J ■ 、， 

夏术 俩疋 . - 


§3单参数情形的假设检验 


设 X 的分布函数是 F (: rd)， 沒 

这就是单个实参数的情形.在实际工作中遇到的多是下列类型的 
检验 问题： 
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( 1 ) H 0 ： d<d l ^H a ： d>d 1 

jf 會 、- ■ .a V 

C^C M 0 ：^ di ^ M a ： d ^ i ) 

( 2 ) H 0 ： de^^d 2 )^H ai de<id lf d 2 ) 

(3 ) 只。：沒 G |_ 沒 1 ，夕 2」— :沒 € L 沒 1 ，沒 2 _l 
(4) H q ••0 = di ' tr ~* 1 H a •• d \0\ 

其中沒 i<02 ，沒 i 6 (a，6) ，沒 2 € (a，6). . 

- ir - -Hr |-| )-1* >人 M ^ - U^i ]Hil 八 -/ r - 上 A 4*/^ tt 人 rVrl FT?T 

平 ~p 只 vj it : 平麥戮议型 or 叩 

定义 3. i 设 x 的可能倌集合县 nx 服从里叁数栺数铟 

▼ ■ 方， ^ ▼ ， _， ，零 ▼ r' l ，^ ^ ~ 醑， f^r ^ f ^ ^ ， P —• 

/ V —JT—• I 1 1 'w r 上 A- # \ / ^ m 辜參 i 占 / tt Irtj^ ——^ v v _1 圓 _ ■ ， ■ _ ■ - —t ^ 、 f 

龙伟，右 A 的甘作钳反 C 取愀半 凼双）句卜列我込 瓦： 

f ( ^ r . R ^=^(^ h ( (^ u 

J X 7 V / X ^ V V X » ^ V X ^ \ v ♦▲彳 

其中 6^0=(a，6)，S(^>O，x6UU)>O，Q(^S0 的严格增函 
数(参看第二章例 2. 3). 

指数型分布十分广泛，指数分布、二项分布、负二项分布、 
Poisson 分布、均值已知或方差已知的正态分布等等都是单参数 
指数型的. 

为了研究复杂假设的检验，我们再对上节例 2. 1考察一下. 

右人可能汴音？II .该伽里仰=丨 0.21 .伯忌屮的且右晷女劝妫的否 

，鏵，、 , i-f w I ^ , ， / 、 1^ -4 1 • \ 一 , — / , 1-^— ^ * » | " y r-» ^ f— « 

« 

定域与“2”无关，即若将0变与©二⑼/^^:^^则导出的具有 
最大功效的否定域与 A 无关.其原因是第一类错误与 A 无关， 
而 p 的作用体现在第二类错误上，犯第二类错误的概率是1 一 

nxu (//I ) = 1 — P ( X〉^ \ =^>( 1. 65 —县标准 TF 杰 4V 

「” q ' jl ， — — jx 1 \ / j — ' -- ▼ - 丄 ， ' — m ■ * * ， 

布函数).可以看出，给定〃时~越大则犯第二类错误的概率越 
小;^越小则犯第二类错误的概率越大，即越不易分辨0与^ . 

I - 、- T+r 44 =t ""*▲ On * TTr I •* ~ r * JtZ * /nf r \ -i ZPt tT»I XA * TTr 

工比 争头促所双 IIJ ， 防 3^ w 0 勺；/ i 兀大,例 _i ti 守到 trj w 0 

应该是针对零假设 H。 : M =0 与备择假设 H a #>0的 UMP 检验. 

- 氬 - • V f 1. » t ▲ v ■ 蠱 — — » k • 、A 1 _ ▲ t A A A . ■ t ■_ • ▲ %• . iv- -w . i*- v 、 ▲ __ _ 丨 

更近一步，边口 J 以捐■想，当检脸 r 口 J 题 殳为： : / i ^0^ M a : ">0时， 

W。. 仍是 UMP 检验。下面的定理 3. 1表明，上述猜想不仅是正确 
的，而且可以由正态分布扩展到单参数指数型分布的情形. - 
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为确定计，以下只讨论指数型分布有密度 /( AW 的情形，对 

- i 、 ▲ 麝» • a - • . * ■> ▲ ▲ ■ 論 k mm > ▲ 、•秦 • - 息 ▲ •、金 

于离散型情形叫进行类似的何论. 


n 


份兄县榉太 W 兄 , X .) = V . VCX ,) . X = ( X , •… • 

一一 X ， / - fi 謹 p I I ，一 \ - i, , - ft ^ 、 - ‘ ， , 、 上 , , 


n 


x .), L ( X . e ) = JTf ( X ^ o ). 

“ ’ ’ 'i 丄 j r ' 

i = 1 

宙捆 _T 1 份 Y 的公亦你庇右门 1 ) 刑給帘給验 [HIM 

W •在 r>^ ▲篡 Ki V /V _ r* U-l I J \ ^ ^ ~r~ . • ^-t-4 1-^* I -4 

h 0 ：d d\ ^H a id ^> d\ 

科 _ 乙 / a 1 、 zStT^-Zr r 雄口 
a^j cr c 、 v / ，丄/ ，幻盯 江 ^ 


n 


P (2 J V ( X i ) > Ci^)=a 


(3.2) 


则 


W 0 = [ 


n 


OC \ 


，工 n ) S ( Xi ) > C } 




是检验水平为 《 的一致最大功效的否 定域. 

证明：从 （3. 2) 知 P ( XeW 0 \ d 1 )= a . 下面 证明： 对一切 dc < 

js I « i^k y "w r tttt" I 八 、 、爹 . it t - 7*lf ^ A> _LA. Tt 入 ►、- ~t tlXT 

%, 笮 t Wo I 外；刀 1 CLW 九恆题 I 口 J 越： 



Hq : d = So < ^ H a id — d \ 

记 

ai = P ( xew 0 \ d 0 ) 

易知 

、 d L ( x 9 di ) 

L { x , do ) 


— ^ ^ r CQ (^)- Q (^)] SV(x ) 

S n ( do ) 1 

故 

w 。 U :1>( A )> C } 

t 

1 


= > A 。} (乏=(工1，…，: O ) 


( 3 . 4 ) 


H 


根据 N - P 引理， W 。 是检验问题 (3. 4) 的水平为^的最大功效的 



否定域，根据定理 2. 3 具有无偏性，即有 

paxew 0 \ d 1 )^ P(x ew 0 t ^ o)=ai 

这就证明了对一切氏<乂， 

PdXeWoldo) <a 

/>-t -e4^- 、 — r* r-#_L /-*• A—^ .1 * TTf 'w * 4*ti 、 *- JL/« t* j 、， xxr Xr^ 1 / * 

双 1 U 丹术！ It : 对 1 士 1 RJ 7 Kt 个姐 xl a 的货疋观 W ，但咽 

|£> V ^ 0 (^) ^ |0 w (沒） （ ~ " "切 0〉沒1 ) 

为此，任意给定 d 2 > d , ，研究检验问题： 


"y^y 


0 :0 


U1 


_ ， w 『 

lj a 

: i / 




U 2 


3. 5) 


记 

易知存在 A 。 使得 


A 


d 


Q \h 


■ L ( x 9 d 2 )/ L ( x 9 d \) 


rrr 

w, 


d 


n 


( 、 t ， / 、、 

U : Zj v h ; 户 I 


一 ={^ e 2 > A 。} 

根据 N - P 引理， W 。 是检验问题 （3. 5) 的水平为 a 的最大功效否 
定域，既然 pwid \ Xa ， 故 

pW o (-02 y ^ pw (^2 ) 

这就证明了 W Q 是水平为 a 的一致最大功效 ( UMP ) 否定域. 

证毕. 

tf-4 - ~n 4^ tiA. r\rt r t ^ ^ tt n ^ n TrT ^4f -41^ /iW AA» 」一 tO 人 

/VJ 丁恨独 IKI 疋 2i: n 0 iO^Oi^n a :(7 、 (7i mj JZTTT 天 IWtTJ 

现在应用定理 3. 1 研究正态分布的两个检验问题. 

✓ --V \ m « V - •■■■/ o v ^ • # *裊—>氬 ^― * rt • i—t 

Ci ) 玟 A 〜 AK/^KKtTo ti 知）•检验 I 口 J 题是 

H 0 ifJL ^ /JLo^H a : > "0 

其中//。是已知的.设样本值是: ^ ，…， & ，如何检验 H 。？ 


.LI〆 rt-^ 

此口 、 J 


fix ,6) 




^=^ ex P 

V 乙丌戊 o v 


卜古(工-户 ) 2 } 

^U{) 


V 2 


丌 (To 


exp r & r exp ( _ ^ r exp 


yx 
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对比 （3. 1) 知 V ( x )=: r ， 依定理 3. 1知一致最大功效的否定域是 


n 


W 0 = { 9 x n ) : 〉 C 


_ 倉龜 a _ ■ _ % .1.1^ k t 

共硏 G 满足 


r 


n 


PfVX , > C\a 
\ / ^ ■ # 


o 


a 




但 


" - iir\ 

广 广 u 


时 


X ^ N { JUO 9 


C 7 2 o 

漏 及為 丄 

^ 0, ^ 


故 

rs ^、 


ft 

pT V xr > c \^) 

— \ / j — ‘ < 一 / 






r 


1—0 


Cn~ T —^fnfio 




CFo 


iJ * _ r\ r\ r~ A » I * A-»-t 叉 / *i /> r— \ ▲ r\ r\ r— ■ * 

右 a = UD , 宜衣沖队丄 • OD ; 土 U . yD . 丁定 

Cti 2 == 1 • 65 tJo 


故 


C = n/io + 1- 65<jo 
这时否定域 (3. 6) 可以 写成： 


W 0 =( 工" 


、 丄 1.65 

X n ) ：X flo H - —CTo 

』 § >•>-* 

, V ri 


(3.6) 


(3.7) 


例 3.1 根据长期的经验和资料表明，某砖瓦厂所生产砖的 

jo cte ,, v an 11 -t- /v -A-* 夕 -t r% -i •人 f i i— 1 err a/* 

t / i 研烛皮 a / jR / Ain 您万邗，刀左 tr =丄.乙丄，，子执识， 

一 批砖中，随机抽取6块，测得抗断强度数据 如下： 

6 Z . 5 t ), Z 9. 6 b ,31. 64,3 U . 00^1. 03 

El . 诗 一 *册誌的巫检枯膝 3 SB 庙可不 *U 士甜奸 ^ n ? 

r m hs mv I r ，j jy u ^ i—I v 、 / v /vx 2 . aa v v ; 

设 X 〜 iVC ；/,^)!； 已知 # = 1.21， 检验问题是 

H 0 : fi ^ 30 -*-*^ H a :"〉 30 

设 a = 0. 05,现在 n =6,^0=30^0 = 1. 1，从 （3. 7) 知否定域为 


W 0 = { ixi , ••• jX n ) tx > 30. 74} 


95 



现在根据所给的样本值 32. 56,…， 31. 03计算出 


31. 3> 


— II II • ^ • - A • • mm. 氣 Vk. k fek-. 1 A. A 貝 - _ ^jm K 赢 II ■_ A —. 氣 Jfc- 

30. 74,故样本值落人了否足域，因而应否定 H q : //<30,所以可以 
认为这批砖的平均抗断强度超过 30. 


(2) 设 X 〜 N (/ i q ^ a 2 ) (//o 已知），设样本值是工1， 
检验问题 . 


jX n ，研究 


H 0 ： a 2 <^- H a ：^ > 


戊0 


V I^i/t 由 ^ 齡曰 

八 avm)^mscL7B 

广/ 9 v 


/o 

V 乙丌戊 


exp 





对比 （3.1) 知艸） 2 ,从定理 3. 1知一致最大功效的否 
定域是 


^ 0 ={(^,-,^) ： 2 ^-^ 0) 2 >C} 

其中 C 满足 

n 

P〆 ( V 、 2 \ d # 2 、_~ 

▲ V X j 、八 i fJLO J ^ ^ \ u o / — u 

t = 1 
J n 

伯 ^= rrl 时 . -L W Y . - 、 2 m U w 白出曲的 Y 2 公龙.剎 

1^- ^ ^ -I 7 2 \ ▲氣 1 卜 V ， AO "、 9 如 I I—I l-M M V^Vp 1 F 7 -I %1 

i 瞀， 2 # % ^ 赢 ，倉 # t # v %.»## a ^ ■■■— 蠱 . 獻- 

mx 分布的分位奴表小难茯出 c; 釆. 

对不 太书并 始坦 m 的治沿給於问 m 9 〉 u 怒时视伴的海 

J -4 r / I 4^c. I-M MV I [A. rjBL H ^ /、'^ / 、 ^ / 7 ^L. *^U I \J MV 1^1 、 

入研究，指数型分布情形已经完全解决了，见下列三个定理.由于 

泳此由 XH66 来 fr 砂 4 工口 0 始 2 换 /rr 攸 ~/r 士甘士 e A6 批 /Jr 今 JJben ： ia?ZV 

双卞 ku-^j^x ，只 lu^nri^i 干 h 小 / =t : 口 yi0 汁丁 71 尸”一 口卜刀 

叙述证明，供有兴趣的读者参考. 

•±p m ^ 1 J/v v -t^ /V -fc <±ft tte 

At J 王 o. ^ 汉 a 书 TT^m)^ 

fU , d )= S ( d ) h ( x ) e Q(e)VU) 

•mT 

这里 S ⑻ XK/iU) 彡 0，Q(60 是没的严格增函数. 

給帘拾輪问额. 

p—• , • ■* ， “ 9 ， J 9 

Ho id ^ COi ，没 2 ) *~^' H a : d G ■(汐 1 ，沒 2 ) 

设 X=(^ ，…， X„) 是 X 的样本，且 
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W 0 = { ( a ，… jx n ) ：Ci < < C 2 } 

2 = 1 

若 P ( 基 I 沃 ） = a (i = l ， 2) ，删 W 。 是水平为 《 的一致最大功效 

->K ： r^-t / T TX j'Tfc -+A. TlA. \ 

(tjw 疋概、 u 丄 v 丄 r mmj- 

宝理 3.3 设 X 有分布密麻 

▼ ▼ ，，， ▼ ' ■ _ 1 '1 , 

V '■ ■ V w ✓ 、 政 ~*\d T ^ \ 

fU ， d ) = 一 w 

aa ( 八 , h \ (— c ^<^^^ u < rnr ^\ 甘 tfa 

\/ v W f / \ l ✓、^ / ，^ %- | \ w / ^ v j i lr \ ^ y 二 V 7 \ U ✓ ^AC- v M V 

严格增连续函数 . 

认 4±r 仏 n^tei 邮 

Ho :沒6 「沒 1，沒9 ^[^M n id G\'^^ 9 0? "I 

(a<d l <d z <b) 

■» V= ( V. ••. V 、且 Y 的伴 ★ _ B 
^ ^ W1L " ^ mv i-r^^-o- 

\ 

n ' 

w <v ( ✓ v 飞 -w ，/ V t ■■ * Iv^ I ) 

w 0 = \(<x l r- 9 x n ) ： 2jy^i) 小卞 Li 现 xt 

t=i 

若 G < c 2 使得 

P(xew 0 \6i)=a G = l,2) (3.8) 

则 W 。 是水平为 a 的一致最大功效的无偏否定域 （ UMPU 检验）. 

r w ^ ， ■ 'w ■ ^ ^ - — — ， r ^ - r ^ - »■ - — ， ^ ， 

定理 3. 4 设 X 有分布密度 

f { x , d ) = S ( d ) h ( x ) 

这里 (a,6)(-^< a <6<oo),S(^)>0,/i(x)>0,Q / (^)>0. 

给定检验问题： 

* ' 

Ho ： d=do^H a id^do Cdo G (a, 6)) 

n 

ZDt V — f V … V 、& 任士 "〜 …〜、—X ^\T ( 〜、 R 

fcX ^ _ V^Vl 9 "- /TET-r^ 9 ' 9 丄 n y — X j Y 、丄以 J=L 

a = 1 

Wo = {(:i ， … ，工 ” ） : ， ( 叾 )<Ci 或 >。 2 } 
r. ^r . 估俱 

、 ^ 丄 、'^ i ； I^T 

PCXeWo\do)=a 

E eo (I Wo (X)t(X))=aEe 0 t(X) 
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(3.9) 
(3. 10) 



( E $ o 乃是对应 e = d , 时的犛学期望 )• 

ft • . marnm •• • • 參 ■ • 身 ‘ Ifc — A Ihk. ^ V»«M. fe A. * 疏 k. 

则 VV Q 是水平为 a 的一致最大功效尤偏否足域 （ UM ^ U 检验）. 

条 #(3. 10) 什么时 候得 到翁足呢？我们指出，若 AX ) = 

2 V ( X ,) 的分布关于某个数 r 。 是对称的，即 

£=1 

Pit < r 0 — a | 〜） =PO> r 0 +a | 沒。）（一切 a ^ 0) 

又\^。=<泛: 〆 泛)小于 n - c 或者大于 a + c } 满足 p ( xew 0 i 
呒）=«，则 （3. 10) —定成立.实际上，此时有 

IT 1 / r / \r\ j./ v\ \ 

^ e 0 yiw 0 






n 




t ) 


( t - r 0 ) J [ f(xi 9 do ) dx + r 0 似 n/u ，沒 o ) d 丟 

1 = 1 ^ W 0 t = l 




n 


n 

( t - r 0 ) J [ / U ，艮） + r 0 P ( XeW 0 \6 o ) 

{\t~r Q \>C} i = 1 


= 0 + r 0 a 

由干 ^ Q — rJ =0 •故 KAl^r (X)t(X))=ryE. t . 汶丟昍备件 

， ■ • _ (/q 、- \j ^ 警 , r>»^v (/q 、一 ww q 、，-、 w i/q - ， ^ 圓 ― ^ o ，， / 缚 、 I i 

(3.40) 成立. 

例 3. 2 设 a ，…， 是来自 NO , 〆 ） 的样本 ，心 已知，研究检 
验 问题： •' 

Hq : d ^ do^^tia : 6^ do 

注意密度 


f ( jo % f )) 


exo 


\/2tk(Jo 




I 


▲ #> 
2 al 


ix — 0) 


X 


2 




\ f 2 ital 


G -% - s o ® 


e 

~2 X 


对比 （3. 1) 知 VU )=: c ， 故从定理 3. 4 知一致最大功效无偏否定 
域是： 


n 

W 0 ={(:"••• fX n ) : G 或 > C 2 } 

* 

1 = 1 

这与直观是一致的，其中 c 19 c 2 满足： 



P ( 〉: Xi 〈Ci 或〉 C2 1) = a 


n 


: V- 


n 


MkQP • &)= ❿。（2足) 


(3. 11) 


n 


n 


a ^ ^ ^ 'w r it ✓外 O v ^ ^ it* 上 / \ ■ 上 • 、 /▲ ■鑫 •/% —•I. 

t = 1 1=1 V.* ； 

称的，故只要取 一 c ， c 2 = w 。+ c 使得 


n 


F { 2 j X i <^ 或>。2丨氏）=« 


(3. 12) 


filll/9 11 、 cfr -rV 

yiy vo # 丄丄 / — 

从 (3.12) 知 


于是 


所以 


r 1 T3cr 

从 IIIJ 


*j 


a 


— ndo > C \ d 0 ) 


2 少 


C 


Jnao 


— r 


y/no 


0 


这里是标准正态分布的夺分位数，满足 

厶 / 




za^ 

T 


e 


Tdu = ^r 




/n 

V 乙丌 


C = _ \pn 


a ^ z \ 


n 


Wo = { (工 1 ，•••，〜）： 7 j^i ~ n 0 o 
\ 


〉 4 n a 。 之 1 - 


a 

y 


(因为 z ^-^ = — z ^) 

' r - - - 2 2 


例 3.3 设兄，…，尤是来自 iVdg ) 的样本 Gj 。 已知），研究 
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检验问题 


H ol deid l ,d 2 j^H a ：d eiOi ，爲] 
从定理 3. 3 知 ，一 致最大功效无偏否定 域是： 


n 


{ ( xi ，…，: c „) : ^ x £ <Ci 或 > C 2 }• 


这里 c M c 2 满足 


P\\Xi ，…， D 6 W 0 \6i)= a (£ = 1 ， 2) 


即有 


^ /C 2 — ndi \ ^ /Ci — ndi 

零 _ v r ' ▼ _ yj 

jC L ^nd 1 \/C l ^nd 1 

\ \ftirsr, I \ \fnrfr, 

\ Y r ^ \j f \ y - ^ \j 


1 — a 


1 - 


C ^ C 2 需通过正态分布表多次试査才能找出近似值. 


当沃 


6 , 时，必有0 2 = — (^，此时 Q 利用正态分布表较易 


求出. 


为了给出定理3.2,定理 3.3 和定理 3. 4的数学证明，我们首先要推广 
N-P 引理 • 

引理 3.1( N-P 引理的推广)设 / 0 ( x ) ,/! ( x ) , f 2 ( x ) , Hx ) , rix ) , 
多(工)都是 S 上的可积函数 （S 是 n 维空间中的区域或为更一般的集合 ），0< 


酱 


( x )< l ，0<?( a ：)< l ,0 O ( a ：)< l , 则有下列结论 


⑴若 


< f > f t dx = < f >* fidx 

J s J s 


U= 1 ， 2 ) 


( 3 . 13 ) 


且 


2 


1，当 / o ( x ) > ^ K t f { ( x ) 


《*( x ) 


2 


0，当 f 0 ( x ) < ^ KJ t U ) 


这里 KhK 是常数，则 


^ * /o dx ^ dx 

s J s 


( 3 . 14 ) 


▲ n a 

• • 



(2) 若多 /, dr = ?/, dx (i = 1,2) 

J s J s 


2 


1 , 当 / 。（工 ） < ^K/. Cx) 


9Kx) 


2 


0, 当 / o(x )> y；K,/,(:r) 

Jkrnrnrnm 


这里 K l 9 K 2 是常数，则 


* /• 

^/o dx < ^/o dx 

J s J s 


(3. 15) 


(3) 若 (3. 13) 中“ = ”号换成“ < ”号，又 & >0，K 2 >0, 则 （3. 14) 仍然 


成立. 


^ ■■ 一晒— ■ 鑫 Mi . _- m 

址 明：小 难看出 


2 


cr - 多 ）（/ 0 — 5X/,)>o 


于是 


2 


S 


( 令 * — 多 ) （/o — X y y i K i f t )dx ^ 0 


所以 


L ， 

(0* _ 彡） f Q ^ 51 K , I ( 彡 * — 彡 ） fidx 


(3. 16) 


从而 


I ^ * / 0 dx ^ < f>fo dx 

J S J s 

这就证明了 （3.14). 从 (3.16) 看，若在 （3.13) 中“=”换成，又 K,^0( 
1 .9) . mil ( ^ 

• 7 W / ， /VJ V V * 1/V 9, 1 • 

2 

从(？一勿（/。_；2&兑 ）<0 不难推出（3.15)成立. 

1 

^ 证毕 • 


定理 3. 2的证 明：我 们首先指出，对一切爲<久及(9 3 >0 2 均有 

PCX e Wo I 03 X a (3.17) 

为确定计，不妨设爲 <& (当 Os > 02 时可进行类似的讨论），记 fjU ) 


n 


U/u, 氏）.我们指出，必存在1^,/<： 2 使得 
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Wo 


d 


x：Ci < < C 2 


2 


{£ 1 / 3 ( 5 ) < S K */* ( 5 ) } 


实际上， 


2 


f « ✓ V _ ^ ^ w r% ✓ V 

{x ： /3Cx ； < 2^*/ 八 5 ) 


n 


n 


{ 5: W 3 )e ⑽ 3)^><V < ^K t S n (0 t )e Qid ^ vc 


{ 孑 : 1 < 2 


a ) eV 


ix= Oi ， … ， *r„)) 


这里 


xr \Xi ) 


bj =Q\6j ) — Q\6z ) > 0 


aj = Kj 


sidj ) 

s ( K ) 


(_;• = 1，2) 


我们指出，对 Q ， C 2 必有 a 1 >0, a 2 <0 使得 


2 


<2 


a>e 


b：i 


/ ✓*"! X 

⑴ 1 , U 2 ； 


ICH L hat ->-* :tn ACT f 一 B -K A-rt 

大 MN 丄，用午刀怔 aiAA ， a 2 疋不 7WXX 


2 

2j^j^ “= 1 , 2 ) 


行列式 


△ 


e b i c i e 6 2 c i 


e A i c 2 


e 6 t c 2 


e 6 i c 2 +6 2 c i [e (6 2 - )(c 2 - c i) — 1] > 0 


于是有解 


ai = yw o>0 


a 2 =4-(e A i c i — e 6 i c 2 ) < 0 

A 


不难看出 


100 


金 


( 3 . 18 ) 



2 


t：l < 2 fl > eV '} = {(: e _ V - a 2 e ( W，<ai } 

l 

但函数 e — V — a 2 …、”是^的严格凸函数，故 


2 


f X：> 

卜 i < 2 j 


6 -i 


aw 


( C \ , C 2 ) 


由 （3,18) 可求出 Ki 9 K 2 ^ 于是对此 ， K ^ ，有 


u 

goifzix ) < } 


n 


X 


「， 〆 " Vvr^.^i 〆 r \ \ = w , 

^ i 、• ^ c \ r t u 


令 


?( x ) 


1 ^4 

丄， 二 ^ ^ rw y 

o ， 当 xew 。 


<f>(x)=a 


注意 






i>(x) f t (x)dx = a = fi (x)dx 

^ ^-W V ^-w ^-w 




1,2). 从引理 3.1 知 


PiXGWn 6,) 

—- ▼ — 




_ 

?( x ) A ( jc)djc 






< 




於 （ x) /V(jc)Ar = a 

V -»*W 


这就证明了 （3. 17). 

* rrrffr^xas 4 s & w 口亜::壬 

1 l-u rj - , n ^ rr , 

—- m. h. *1 l_l # - Ifc - 身- 

於）），则一足有 

PiXGW, \e) >P(xew\e) (eG(e' ， 02)) 

— I r — _ 

任意固定氏 e (仍，免） ，仍记 , 


n 


^ \_ I I jrr — n \ / - _i o o >i \ 

Jj\xj 二丄丄 /，(7" 二丄，乙， O ， v 


游们 描屮」 I /、 右 K \ ^> n . K \^>0 估逍 

|P ^ 7 >W I * * 1 ^ 7 各 ■ C ， v V VI 


2 


Wq = {孑:,4(忑） > ( JC ) 


实际上 


2 


f IX /) () 


切 ee ( 0 " 
(3. 19) 

(3. 20) 
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2 ft 

=\x ： l> \ ) exp { [Q(^-) — Q (没 4 )] 女 VXa) } J 

V i \ ^\Ui / / 1 / 

2 

= { 孑 : 1 > 2 a > eV } 

I 

这里 

b \ = Q ( 0 i ) — Q(fti ) < 0 
bz = Q (沒 2 ) _ Q (沒 4 )〉■ 0 

a ， =K ) %7j\ tt= ^j V( ^ Xi) 

w4 / j 

与前面的论证类似，知可取《 1 >0，七>0使得 

2 2 

1 = y ^ i a j e 6 > c i = e 6 > c 2 

1 1 

2 

• ■ • ^ JL i »—• 9 丨 I ^ 丨 • 

囚 Zj a > eV 是 t 的广格凸凼奴，政 

1 

2 

1 1 : 〉: ay eV < 1 j = (Ci 9 Cz ) 

i 

U /7, >0.A^>0 初右 K ">0.fC.*>0 你俱 d 20 ) 成古 _ 

，，、 — r X ^ v ^ Ct — ' ^ / W r-w I ^ 一 — X v / •• 乙 I 、一 _ — 寶 ， ~ x - w 

取於 * =/w 0 ，>=/w ( 示性函数），则 

m 

M m "■ jT — wr'W* ^ v. 

V /, dr =^ CA 6 VV 0 0 i)=a 

^ -" S«r 

^ P(X6W - 1^.) = J^/.dx (f=l ， 2) 

根 据引理 3.1 知 

[V/ 4 d 5 > f^/ 4 dx 

j j 

即有尸(叉6%|氏）^?(；^，|氏），这就证明了（3,19). 

r.i.i ■ I 攀 

定理 3. 3 的证明：为了证 W 0 的水平是《，只须证明对一切 ft € (负 ，0 2 )有 

Pixew 0 \6 s ) <：a ( 3 . 21 ) 

记 

71 

fi(x) = TT fix ； ndi ) (; = 1 ， 2,3) 

j ■ ^ * - - j - 

1 = 1 

我们指出存在 k^k 2 使得 




1UZ 


m 



实际上 


(3.22) 


w 0= { x ：/ 3 ( x ) < ^ Kjfjix ) } 

i 

2 2 

(x ： / 3 (x) < }= {x：l < 工 X.eV } 

1 l 

这里 

b \ = Q (. 0 \) _ Q (沒 3 )〈 0 

b 2 = Q (02)— Q(ft )> 0 

r c ，/3, a 

= Kj ^7^* (i=l ， 2) 

_ ^ v 1/3 / 

n 

t = y . vKXj ) 

i 

解方程组 

2 2 

1 = ^]aj e A ； c i = e 6 > c 2 

l l 

2 

可求得 A > 0, a 2 > 0,从而可确定出 K ! > 0, K 2 >0. 由于是 f 的 

i 

严格凸函数，故 

2 

f . 1 ^ 、 _A .t 1 / _\ I \ / _ 、 

yi：i y k a^y 少 = 、一山 u ，认 v 

1 

所以 （3. 22) 成立 • 

取 i >( x)=a ^( x ) = I Wf , ioc ) ，从引理 3. 1 知 

j ?/ 3 d£ < j i>f 3 dx 

即有尸(叉6研。|氏）< 0 ，这就证明了（3.21). 

为了证明 w 。 的无偏性，我们首先指岀对一切氏]，必存在 Kp 

k 2 使得 

2 

W 0 = { 5 : / 3 ( 5 )>2 X /,(5)} (3.23) 

1 

不妨设爲>氏（当氏<久时可作类似的论证），显然 

2 2 

i xi A(:c) > fi (jc) ) = ix：l > ) 

- 一 〜 j 切 j 〜 / 、〜 , ) 

1 1 


这里 




1UO • 



b \ == Q (6 t ) — Q (0 Z 丫 <C b 2 〒 Q (6 2 ) — Q (*^3) < 0 




Sidj ) 

SidO 


0 = 1 , 2 ) 


y 


n 


2 V (々) 


解方程组 


2 


2 




2 〜 e 〜 Cl — ^Qje 6 > c 2 


可求出 <2 i ， fl 2 且 ai < C 0 ，<22 〉0 ，从而可求岀 fCi ，尺2 • 

江忠 


2 


{ t：l > y ! a,eV 




{ tia 2 < e 


一 bi 


a x e 


(6^ 一 6 之 ）： 


但 e -V _ 化 e A _ 是 f 的严格凸函数，故 


2 


1 > eV } = (— oo, Cl ) u (c 2 ， oo 


所以 （3. 23) 成立. 




/ . \ ± - Rill 

\x> 9 y»=a»!«*j 


r 


f* 


^ f t dx = P ( X^：Wo \ 6 i )= a = ^fi dx ( f = l ，2) 




从 （3. 23) 和引理 3.1 知 








« 


fz dj ： ^ rf 3 d 工 




即有 P (在€研。|0 3 )>〜这就证明了 W 。 是水平为 a 的无偏否 定域. 

设 W 是水平为 a 的任何无偏否定域，我们来 证明： 对一切爲 e [氏，於]有 


实际上 


P(xew 0 \6s)^P(xew\ds) 

Pixewie) 


(3.24) 


ft 


n 


mm w 

w 


S n ( 0 ) JJ h ( xi ) exp { Q(6) ^V(x t )}dx 


既然假设 Q (0) 是连续函数，易知也是0的连续函数，根据无偏 



性，(—切，办 ]) ，利用连续性知 

X 'W 'W 會 W f 1 m V 、 

^ W \Ui)^ a U—UZ) 

另一方面， W 的水平是 a , 从而 

* 

p(x e w\e t )= a g=i ， 2) 

仍记 y ，令 ？=“ ，则 

f.dx= PCxGWn 6.)= a 

冒 ■ w - » 『 — 

Aw 

=P(xew|^)-f?/.d5 (i=l ， 2) 


利用 （3. 23) 和引理 3.1 知 

V / sd 5 ^ 

w 


?/3 dx 

一 w 

w 


即 

p<xeWo I 爲） ^ p ( xew \ dz ) 

故 （3. 24) 成立.这就证明了 W 。 是#致最大功效无偏否定域. 


定理 3. 4的证明 ：任给定仏今 汍，令 


n 


f \ ( x )= LCa ： f 0 o )=^ j L fixi 9 do ) 

i 

fz ( x ) = L ( x 9 ffo ) t ( x ) 


A ( x ) = bix %8^ ) 

j v ， ■* f ~ m> ~ 


•a^^lrn 9 .霪 4 》 .V A M - ^ l^ 1 # 

获 1 『 j 宿出，必仔 在 M ，八 2 便得 


Lt 

W 0 ={ x ： f ^ x )> X i K j f i ( x )} 


实际上 


2 


x ： / 3 (x) > ^Kjfjix) 




xie 


a x — a % t ( x ) 


这里 


6= O (0 i ) - O (^) 


a 


K 


S(0 O ) 


^ r\ V 


(；=1,2) 


解方程 


vfm . 

F ■ ■ ■ I ▼ 

(3.25) 

> 0 } 

^1 r\ r~ 

m 1UD 9 



.bC 


1 — .a\ — <22 Ci = e AC：2 — a\ — azCz = 0 


，上 久人 j i • 上 h _ -T* .•鼸 II p _* ■* 遽 _ fci _ rf, l ■ * JL. K=i H 

河 眾疋的 U 山 2 ，nj 氺 ai ， a 2 ，从 mjnj 俩疋 ， A 2 ， 田丁 e” 一 化一七 £ 足 t 的 


严格凸函数，知 


{ . ht 

M ： e ' — a x 




_^ \ t I / _ 

00 山 1 ? U ，… 


所以 


2 


;:,3 (£) > 2(5) } = <£， 〆 £) < ，或 > C 2 } = W 0 


即 （3. 25) 成立. 

■1L- ~~^ ^tt* a 口 TT7- AA ^rr. / 占 iji. /_、-• <<4^ ， - r* 

yy j mm w 0 trj 兀期 t 土，识 iij 术 nt 


P ( XeW 0 \6 x ) (6 i ^0 o ) 


(3.26) 


A I M _ T / 、 I _ ta 一 

^ 9" = Jw n (x ； 9 f>=a 9 ^W 

[J 




♦ • fidx = P(X W Q \6 o ) = a = ^fxdx 

[r Mx = Ee 0 Hw G ( X ) KX )] = aE e j ( X )= [V/ 2 d 


(这里用了条件 （3. 10))， 利用 (3. 25) 和引理 3. 1 知 


， r 

i >* fsdx ^ ^/ 3 d £ 

j ij 

即 P ( jeW 。 I 汍）彡 a , 这就证明了 （3. 26). 

设 w 是水平为《的任一无偏否定域，我们来证 :对一 切氏专氏有 

P ( X 6 W 。 | 的） ^ P ( X 6 W |^) (3.27) 

为此，我们首先指出： 


令 


E e ( I w ( X ) t ( X )) = aEej ( X ) 

0 ^\y U /s ^ 




< p ( d ) 


n 




w 


丄1丄 


/( Xi yd)dx 


易知县 0 的可微函数.沣音 

▼ 〆 ■ ~r 、， ， ， _ _ 1 ^ w ■■■_■— 丨 u #， 


(3. 28) 


0 ( 00 ) = PCX e W \0 o)=a 

根据 W 的无偏性 〆 0)>^ =以氏）（一切 0), 所以4(没）在0。达最小值，从 

■3CT ，^ / n \ _ r\ 

\\\up v(7o j —yj. 

但是 





于是 


n 


ip ( e )= c ( d ) d 5 

w w i 

( C (^) = [ S (0)] n ) 


、 V ， 、 V X 




r n 

「 TT 


h ( T ,) e QWt ^ dr -\- 


w 


但 


网辺爾間知 


cw 




f 


n 


W 


TU(:r,) e Q _A(a:)0’ （ (9)dr 

靈 _M ， -W 


C /( ff ) 

— 、 w , 

WeT 


"■' m w ， ，，、 I / jf A v v «■ 「 ▼ ✓■wv'v /tv、~™1 

t. e l w iA ) 十 y ^ ； ^L/wCA ； nA；J 


r 


n 


c(e)[[hUj)e Qieu ^dx 




八 (沒） I ✓ >« 、 T'* _ ■/ r X ，、 


从 〆 (汰 ）=0, 推知 


— Q (do ) E§ o t • a Q C6 q )£〜 [iV • i] = 0 


工良。。、由士 
J 疋 W . Li % J ； 

仍令彡 * = J w 。 ，又令？ = J w ，则 


r fidx = | 免 ） =a = P ( xew \ e 0 ) = ?/id 






从 （3. 28) 知 


r 


« 


fzd ^ 



0 匸 (5 )〆 


aE , o KX ) = E , o [/ Wo ( X ) KX )] 


， 

^fzdx 




利用 （3. 25) 及引理 3.1 知 




♦ • Adx ^ 


_ 






即 


pcxew 0 |ft) ^ pcxe w\e x ) 



这就证明了 （3. 27). 


\-r- UL*> 

ut 平 . 


n m —tj * 

§ 4 ) 乂似然 n : 怔纸 


上一节处理问题虽很圆满，但所讨论的情况太特殊，对总体的 

isihhmm ihi^r ^ m ~r 女甘 

i^-r-yj hj ipc j» r;; rpc wj f yr m ^ pu 狐迦 i w j i ， j ， i 、 j • ^ h 

介绍一种检验法，它适用的范围极广，当样丰量 TZ 较大时，否定域 

分分 -to 业 -Af-r / Fm 始一-也 Af4f ) 口 AA -MiT 办 t l> ■We 丄 \ 口 占 -T* 占曰 Z^r 

1 工1工 TH =( 灯、 pp 禾一天爾厌 trjm 芊 Ki 权 / J 、7 ，丑7众匕1、一疋疋一取 

最大功效的.多数情况下可以证明 lim “（<9) = 1( 对一切 <9 Ga )， 

^ ^ ^ r ^ — w - — , 1 w ^ M 一 vw — ■" 罗 ■ — 办 

7, 1 0 

这里 H .^60! 是备择假设，^^^ (们是参数真值是 (9 时检验法 W 。 

4.1— A/» vZT=> /I-I1 、 rr 上 L _A_^ 

: TE 粑令假议的 概半 . 

〆 

X 的斗布浓苷县 .… .A 问广对禽散 

* 晨 »-• V /V •厂 <-M J 、 7 V ^ 7 \y 丄 7 7 V Jfi ， ^ - ，_ ♦ I 、，， 

型分布可进行类似的讨论). 

瓜。且。 66 db 六亩工隹 m 命於必 ivnaff 

/0 疋 ^ PU -I 卜工 : 《r J 术， H/I 几孤进 : 

Ho ：^G So^H a ： d^ © — ®o 

_5/t- / 、 1=1 4*44 -4 - 'r / 'r ir \ AA /dtr /nl ^*N T / 

w . go = kx y ，…，: c „; 定忏平 a =、△"•••，△„; trym . 1 以热 ehsjuv 丟， 

* 

n 

6) = /(x z ， (9 ) ，令 


定义 4.1 称 


- d \ 

L (@ o ) = sup Lixjdj 

托 0 。 〜 

^1 

L(@) = supL(xfd) 

eee 〜 


✓ V 


\ Kx ) 


d um 

■ 'V. —— ' 


L (0 o ) 


-Jkr /^ _ / _ 」 -_ 、 AAt r ^* vV /l\l iA ^ 

yvT 十千 ia 泛 —— vxi ， -” ，丄 n j wjf 入 众 i^u. 

显然 A ( x )> l ， 首观上看，若 H 。 是真的，则0的最大似然估计 

• ■ - r\^ " - — — - ■* ^ - — ■ ^ ^ ^ 

应该很大可能属于0。，从而 A ($) 应该接近于1;反之，若 A (# 的值 



太大就应该否定 H 。 ，这样应取否定域 

f 


W 0 = { x ： X ( x ) > A 0 } 

(4.1) 

其中 A 。 满足 


sup PCX^Wo \6 )=a 
oee 0 〜 

(4.2) 

汶宙 ~ 县雨生給宙的松龄 v 

‘ ^ y u /nw v i -^ - /碌， I 、 w \^ \ 备 ,• 



这样的检验法叫做广义似然比检验法，简称似然比检验法. 
这个方法在许多情形下常可导出有实用价值的具体否定域.在使 
用广义似然比检验法时，关键在于能否找出 A 。 满足 (4. 2). 


我们指出，广义似然比 A 是充分统计量的函数，从而否定域 


(4. 1) 常常是由充分统计量来确定.实际上，若 〆 各)是充分统计 
量（可以是向量），则有 L { x , d )= g [_( pix ) ^6] • 九（丟），从而 


Xix ) 


supg [^( p { x ), d ] 
sup glcp ( x ) , d ] 

托 0 0 


z [ f ( x )] 


所以否定域 


vy 0 = {x ： A(^> > A 0 } = {x ： ^(x)6B} 

这里 B 是适当的集合 \ 

由于正态总体在实际工作中最常见，数学处理上也比较成熟， 

~ T 4 T3LT >—U >Ai T* -kr* /-I* AA 知 7T 人 I^Tl 

P IflJ VJ 廿竹 | 恨现 

(1) 设 X 〜 N ( JU ，( T 2 ) ， CT 2 已知 ，户 6 ( — 00, 00 ) 考虑检验 


Ho ：/ U = / Uo < ~^ H a fJLo 

给定 a = 0.05, 样本是足，…，又，如何检验 Ho ? 

* f 

A LA. -r* A « Ll-LT —• / - O ^ . t - JU~r* 、 t - —^ ■ 1^1 — f-rt _At • L.K » t . LX 、， L 

这个恆軀问题匕任 s 3 干術厌 J , 规仕用）乂似然比恆狴法 

来试一试. 

似然函数 

/ 1 \ n -I n 

6XP (-点？ U _ ") 2 ) 





) 2 + nix — 



因为 @。= {//。 } ，易知 LC ® o ) = L (泛， juo ) ， 



L ( ® )= t / fc ) exp (-占 $ u _;) 2 )， 

V « , w ^ i 

于是广义似然比 A = e ^ (I '" 0>2 ，可见否定域 

4 

W " o = { 泛:又(泛）〉. A 。} = {x ： | x _ yUo 〉。 } 

其中 C 满足 

P ( X — "0〉 C |" o ) = 0.05 


因为时， 


/~ 
Vw 


a 


( X - juo ) 


〜 iV (0， l )， 故利用正态分布表知 C = 


^ a . 这样得到的否定域与§3中获得的否定域是一致的，从 

Vw 

§ 3中知它是一致最大功效无偏的. 

( 2 ) 设 X 〜 iV ( 户， CT 2 ) ，@= { (" ， CT 2 ) •• — oo<^<oo, 0 <(T 2 <oo} , 

方差 CT 2 未知，检验问 题是： 


Ho 


fJLO 


H a 


Uo 


这类问题在实际工作中更常见， § 1 中例 1. 2即是一例. 


我们用广义似然比检验法导出合适的否定域. 记0。=:{(綁， 

?. x ? ^ r\ \ >rL / 、 M / -xr "\r \ AA AA 

a ~ ) : cr '^ u / ，议泛 =、 xi ，… ，: 定忏平 a = va 】 ，…但 • x trj 

似然函数 




r\ 


L { Xy 6) 






exp 


iza 


2 a^ x 


x] ioCi — fx) 


-A 


iza 


exp |- ( x , — x ) 1 + nix — fx ) 

* V — — 1 


d 


( d =(/ JLj (7 2 )). 易知 


n 


L (@) = supL ( x ^) 




n 


n 


27 T ^]( x t — X ) 


1 n 

〆 ■ I _IMM» 

e 2 




110 




\ 



L (@ 0 ) = sup L ( x ^)= 

^ e 0 〜 


于是广义似然比 





fJio 


) 


_iL 

e _T 




显然 AST 2 的严格增函数，故广义似然比检验的否定 域为: 


n ， ( y v I I 、 Y y a m v 

W 0 = UXi ，…， 工 "）： I i I > 07 U . 4； 

其中 c 适合 

P ( XeW 0 \^ o ^))= a (一切 J ) 

II ― * Atn —— n-+ 4A: Ht2 II_1 da i-l-r 由 ‘ Z\. -fcr +/r 

/ yv 用一早 沖 fj — fio W 、 J ，机 H 里 2 / jpc/yv M 丄 i j=i P = N 叉口 、J 心力，队 

(4. 4) 中的 C 可从 i 分布表中査出.例如《 = 10时，自由度为9, 

八 A ▲ • • • JT\. y"v yik v"v 

a = 0. Ub 时宜 ffi U=Z. ZOZ. 

不由诚 a 4 ) 右你 仔自杜肺？ mcnip 昍亡县一疏畏+功输子 

■ A ■> 、▲’ ▲ / f 'J I L/ U I i • y U * -J • jf -4 Immmi w ^ 

偏的否定域.证明过程较复杂，超出了本书范围.读者如有兴趣， 

it I tv * At r 1 o~i 

m j Am / vL 丄厶」 • 

例 4.1 用某仪器间接测量某物质的温度 （ °C )， 测 5 次 ，数据 

㈡ -I ^ r\ -% r\ r* ^ -t 八 j r -i r\ 八 -% /*\ r7 r- . f * I r~t t~l*V Jit* ilfJg - r^Ar. —^― >. 、 1- — \t3 

定丄 ZDU，i ZDD,1 Z4D,1 Z0U,1 Z/D ， TO 用別的栢俩力汰恃到孤厌的 

耆 

值洳1 277「 m 着你 直值）问拔仪 恶_俎右〒:衮统偏荖？ 

I n. / V — — 、 - 罅， R=i I 攀 I I~l. ， • I -4 r/、MM MUk I ^ ri'W yl-L^. • 


H 0 


由于测量值一般服从正态分布 Nh ， 〆 ）， 这个问题就是检验 

_ 1 onn /D 曰 -t* 必曰 土 A*n A/t 40 -feR L* 高 <5 朴 A/t rft Tfit 太 4cfe 
一丄厶 /, ， i ±± 疋刀左疋不沖 trj , tki /5 丄 w 町 trj ，孤取 m 桃 


W . = U 

\j * 免 


x 


•參# 


.JO,), T ->C) 

f — — . ■ ^ ■ - ■ r 


其中： T 由 （4. 3) 给出 U = 5)， 查纟分布表知 a =0. 05时 ， C = 


111 



2. 776 •故 


{(工"…，々 ）： \ T \> 2.776 


根据所给的样本值， 计算得 I T | 


18 




r o o a 

o . ooy 


>2. 776,故应否定 H 。. 


换句话说，该仪器测温有系统偏差 


✓ n 、 ' n. "XT' IT/ 9 X 9 一 t* 

议 A 〜八木却，： r 


tn JJkA _X- At* ^»_L —r- XA. *st 八 

，；定仵 + 但，別丁恨诞 


mm 


H 0 :^ JUo^Ha ifJL >> 

前田广 以 介丨缺 M/ 拾胳吐岛 Oi 不中 +5^ 

/ 誉 J |«A 1U^ V-U |J!L U-l I_l /tr <5^ ； 

W 0 = {( x 1 ,-, x „)： T > C 1 } (4.5) 

其中了的表达式见 (4. 3),(^ 由方程 

，oo 

tn-i ( y)dy = a 

’ J q I 

•WU —A • I1-* / 、 l=» d A -* - t • >m- J » . t l * - J /- /' t ■ > ^, f 

俩疋 . 这里 G-iCW 定 n__L 个目田皮的 r 甘作的甘伟钳反 • k pj 

査表得到. 

細 ^^ >* Mu i^fc. ▲氣 A. —_ A 教 ■ dll _ ■_ 1^— 

否足域 （4. 5) 在直观上甚为合理.数学上可以证明，它是一轶 

县 +rft*frqp/ 白 66 矣 m 女姑 non 

j»x.yv^ aa.>/u wm wv ，泛 ju 人 wvl 丄 。」 • 

% 

类似地，对于检验 问题： 


r r r r ^ 

n Q xfx 夕 fjiQ^rJa xfi 

可用广义似然比检验法导出否定域： 

習釁 ■▼丨 ，噘 ^ r ^ w —■ ■ ■- w 雩 ■ ▼ ■» - w w ~ w r i — 

TT T { / 、 % 

, W 0 = i ^Xi ,••• ,X n ) : 1 <^ C 2 I 

* 

苴由 了的 卖饮才叁 0U4 : n.r 。 mB-frm 

^ I — r^9 ^ - ^ W \ *馨 ^ v L < />W 


/ A V 

^4. D ； 


tn -\ ( y)dy — 1 —d 

C 2 可查 r 分布表得到.可以证明否定域 （4. 6) 也是一致最大功效 
无偏的. 

(4) 设 X 〜 AK ^ a 2 )，" 未知，考虑检验 问题： 


H 0 : ct 2 = al ^ H a : ct 2 ^ a 2 0 

给定 a €(0， l )， 设样本 x =( x " …，; u 的值是丟 =(々 ，…， 


1 1 o 
11^ 




X n ). 利用广义似然比检验法可导出否定域为 

= {(j^ ， ••• ，工 ”） ：m > C 2 或 < G } (4.7) 

其中 

m = -4-^(x, — x) 2 (4. 8) 

Oo ! 

Q < C 2 满足 .： 

P(X6W" 0 \fi^ao)=a (4. 9) 

可以证明，在 H 。 成立的条件下“二以尤，…， X „) 服从 n ~ l 个自 


由度的; f 2 分布. （4. 9) 等价于 

m c x roo 

gn-i ( y ) dy + ( y)dy = a (4. 10) 

w 0 ^ I 

这里(: y ) 是 《 个自由度的 X “分布的分布密度. 

-31^ / a n \ -tA- nut I ▲ -l=H 人 na l i、i n 口 4*rt ffl 

W 疋增、兮 •, 夕住力百双子 - C HJ 以 ilL 明， itVI 氷。 1 ， 


C2 满足 （4. 10) 及 


c 2 

grH-i ( y ) dy=l —a 

C , 


a 7 、 a . 成且 一 t-Tft 祕二 cw 白 Aft 

外 u 口 ， / 疋 — 从取夕 、夕 _ 口 :/ • 

在实用上常取 GCC 2 ，满足 



( v ) H 




V 






C 2 


gn - i ( y)dy = 


'/ A 1 I \ 

d 11； 


这样的 Ci ， c 2 可通过查 / 分布表很易得到. 

例 4.2 某车间生产铜丝，生产一向比较稳定.今从产品中随 

tzx^ Li- -at-* - 1 八 ij-» _LA. —X- t I. Jj— hbr* f : /hj 山， - i-t-t 丄 ― —r— 

使畑取 iu 恨恆宜兵 伉断刀 ，侍数惦則 r •. 


578,512,570,568,572,570,570,572,596,654 

-羞 —■ . 觚 ^_— 参 I ik %. M - -— ■為 鏖 - - ▲ ■ m 黪 ■— • k _^ 齡 ■ m I «t - 蠢 

问：是 否叫相悟该罕间的锏丝的折断力的万差为64? 

田 Y 主士網々々 66 忙敗；士 7TT IM -t l- ^ 一 2 、 ife 4n 66 iX 

川八你 TT4 ±±L MV 4/1 Kyi KA PV /V 八 _ ， v/x ， u / . g 人 H J W ；； | 丄 

务是根据样本值 A ，… ， x lp 来检验假设 H 。 ： cr 2 =64. 



根据上面所讲的，应取否定域 

W 0 = { (xi ,•••， xi 0 ) :u < Ci 或〉 C 2 } 


苴中 

， 1 § 



H » ✓v a I t a t \ / ^ I • 墨 • 少 a 

铒疋 a = 0 . Ub ， 从 Z 甘伟衣鱼恃 Q = Z . m , U 2 


-• ✓v \p44* i I y a - • v 

= iy.u 俩疋 d li ;. 


根据所给的样本值工 1 = 578 ，〜，^ 1 。= 584 ，算得 1 / = 10 . 65 .由 
于 2 . 70 < 10 . 65 < 19 . 0 ,故观察到的样本未落入否定域，从而应接 
受假设 H 。： ct 2 = 64 . 


( 5 ) 设 X 〜 AK ； u ， ct 2 )， 研究检验 问题： 

T T 9 少 ，* 9 T T 9. ^ 9 

n 0 ： ff " ^ ad ^ n a : cr " ^ ^5 

用广义似然比检验法导出的否定域是 


VV 0 — { ( x l ,•••， x „) : m 〉 C 2 } 

甘由的圭;士才 ra 广 a 嫌 s . 

I ^ MV -VV ACJ , -*- A < VLJ V u ； 


C 4 . 1 Z ； 


gn-i ( y ) dy = a 

这里心- 〆 ？) 是 n _ l 个自由度的 X 2 分布的密度.数学上可以证明 
否定域 ( 4 . 12 ) 是一致最大功效无偏的. 

类似地，对于检验 问题： 


H 0 ： a 2 > aWH a ： a 2 <al 

用广义似然比检腧法导出的否宙诚县 


• W 0 = { (xi ,••• ,x„) ： w < Ci} (4. 13) 

其中 w 的表达式见 (4. 8) ， Ci 满足 






nr 

«n-l 




"ST IW ^ZT 口口 "3FC 4cfe / A 1 o \ 曰 _ _ -t- -rU -ftU -XI 油 A/t 

HJ kA HEWAt# 、吁 • 丄 O , 疋一 取 


( 6 ) 研究两个正态总体的假设检验问题.设 X 〜 N ( A ， d )， 

TTr O v ^ ^ # # _ I \/ > - i~t ^ v v ► v t f . L\A f i t""t v 

r 〜 AK " 2 ，的） ， A 的怦不是 A = CAi ， …， ), Y 的件不是 Y = 
( Y , : .V ). 典们份 而+迷太* B 百她古 ： fiff 右下刺給給问 M . 

'▲17 7 丄羚 2，7 || j *>%. r'<j | II f ~T^ r \ m ― v-a -u- • »v I / u i y ^ r %i • 


Ho : a \ 


= a \^ M a * a \ ^ a \ 



给定 《6(0，1)， 利用广义似然比检验法可导出否定域是 

/ y 、 ^~ 少 \ ,✓ A —A m "V. 

\ y 0 ={ U 1 ,-, x Wi 现 > U } C 4. 14) 

其中 


这里 




ixi — x) 2 / (rii — 1) 

F = ^ - (A. 15) 

- H ' - w - 一 ' 

n l 

2(% — y^ 1 1 (w 2 — l) 

i 




2 ^ 

i 


怎样确 定 G，C 2 使得 Wc) 的检验水平是给定的 a 呢？这就需 


要研究统计量 F (将 ： C 


»V; 


都看成是随机变量）的概率分布.沣竟 

• ■ ■ p w r r p — • 'W w ^ p »■ ■ ■ — - 



/ '尸 "Tr x 

<, A t — A ； 



I v ：~> 一 2 . 

- i 2 j (y > -y)Z 〜 r (〜一 l ) 

Ot 

而且二者相互独立，故在 H。 下统计量 F 的分布是完全确定的，与 
fix ,CT! ,^ 2 ,(7 2 无关.当然 F 的分布与 A， W2 有关，只要 F 的分布求 
出来了，则不难确定 (4. 14) 中的 Ci，C2. 


定理 4.1 设 $〜: r (〜），^〜； ru 2 ) 且$与7；相互独立 


1，W 2 >1)， 则的分布密度是 


7 J / n 2 


「0, 


w ^ 0 


fn ,, n 2 iu )=\ 


2 


V 


P( 打 1 + 

^ ( r lLV ^(^^ UL ,^ 

I | 认 - 1 丄 ■ M, I 

n 2 / 


rf 生) r / w 2 、 \ w 2 


u ^> 0 


JT m ^k. 

C 4.16) 

诗+ 姑公女加笔挪农公由 A 证昍彳 IP 昍古法县亩垃彳+管而 

I -ih rLJ l/v i^u —t - ru I i—wi- 74 7 icul* -xv im >s& i—i- 4X r I ^rr n 

个相互独立的随机变量的商的分布密度，无非是算一算积分，这里 



从略(参看 [1]). 表达式 (4.16) 以后并不用到，读者不必记住. 

定义 4. 2称随机变量 X 服从自由度为的 F 分布（简 
记为 X 〜 F ( Wl ， W 2 ))， 若它的分布密度有表达式 (4. 16)，这时 Wl 叫 
做第一自由度 ， n 2 叫做第二自由度. 

II / m 1 r 、 -rm a -i A-n /，*- 、 f 白 - Iltt V I - L \L _ -i _ 1 

办丄疋埋 4. 丄沖动: TT 星夕 ARAB ni — 1, W 2 — i 

的 F 分布. F 分布的分位数表已经造出，查 F 分布表不难找到 

^ ^ v 1 1 ▲ _ % 

(^<(^满足 

*Cj 广 OO 

fn,-Un 0 -l ( W > dw + /n.-K^-l (u) du = Q (4. 17) 

JO J c 2 * 

于是在 H 。 下 P ( F < C ! 或 > C 2 )= a ，从而否定域 （4. 14) 的检验水 
平是 

数学 卜可 以证明 ： 如果 GCG 满足 （4. 17) 及下式 

^ T ▼ 11 ■圓 1 ▼ - ▼ - ^ - *- ■ 丄 w ▼ w ' •"tftr ▼ - — ^ 


这里 





71\ 一 1 
TU 一 1 


C t + 1 ) , 


f = 1，2 


■w^ / 、 tr^ 一 / V I - 上 , ▲ J I • 1 >_• ^ ▲ t—t»l u • k X ^ I tv ✓ A - • J 、 - I ^ .TT 11 . 

伙，八 : y) 定 p 甘伟的钳反凼奴，则伢疋墚 （ 4. 14) 是一软敢 x 叨双兀 

Kl>y M V • 


奄实用上常取 Q , C 2 满足 

W 芦 

1 fn x -\,n 2 -\ ( y ) dy = / ni -i,„ 2 -i ( y)dy = -^ - (4. 18) 

mi 0 « C 2 ™ 

注意 



r / \ 1 ^ r T \ 

Jn x -un 2 -i^y^y=rKr Oi n 0 J 




n / 1 、 1 

r { F^C 




嚕 00 

— _! fn z -\,n x -\ ( y^y 
%) Cj 

丄 L 门 TT AJ^ l^r -Til tJTt / V ^ Al=t -FTtl 

炚 ii 汉 u 刊用 t or 邻衣恃到 . 

伽 d mi 伽 1 R 4 n 70 ° Pir 的 3 S , 士粉描县州 HR 8. 

^ X IX ^ 丄 • V ， •、^ I M ^ J 二 /-f 4^1-4 v 7 ^ # ^ 7 

19.8,20.9,21.5，19. 5,21. 0,21.、2;80 °C 下的强力数据是 17. 7, 




- ii /^ 

no 






20. 3, 20. 0, 18. 8, 19. 0,20. 1,,20. 2,19. 1. 问 ：70 °C 与80 °C 下的强 
力的分散程度有无差别？ 

设 7 0° c 下的強力为 X,80 $下的强力为 Y， 实践经验表明， 

v ■ » f 

X〜 iVCp) , Y〜iV (舛，4 ) ，所提向题化为检验假设 H。:tr? . 
根据上面介绍的理论，应取统计量 (4. 15) 及否定域 (4. 14) ,其 


中 Ci，C2 由 （4. 18) 确定.本例中 ， Wi = W2 = 8 , 取 a = 0 . 05,査表知 

$ 

0 

Q = 7^，^2 =4 . 99. 根据所给数据 A =20. 5,…，； c 8 =21. 2,3^ 


= 17. 7,…， 3； 8 = 19. 1， 算得 F = 1 . 07 . 由于 ^<1. 07 < 4 . 99,故 
样未落入否定域，应接受 H 。， 即认为70 °(：与80 ° C 下的强力分 

44*1 ^. HI I _Lr-» I— >1 

取 住反相 H 

时不而 + TP 太 >( 太的於路间 Sff . w 

八 j g n 1 1 1 > Jiii> nr m v rjr/. i^j Aoii • 

H bia \^ aW ， H ai a \ > a \ 

• 、 * Tit-* 1 • J 1 ， t ■ 

M 取仿 疋碘： 

w _ = / r 、广 \ ，“ 1 cn 

u 11 〆"" ) \~^» 丄 U/ 

这里 F 的表达式见 (4.15)， C 2 由下式 确定： 

i 

fn x -i t n 2 ~\ (3 ^)dy = a 

. J c 2 

n ttt i+t I ? 瓜 ~*r 主士山 
^2 h j m ^ yj 叫双且山 • 

数学卜可以证明，否氣城 （4. 19) 甚一敏畺女劝 放子徧 的\ 

聲 ， ■ _ ▼ ■ ， ▼ ， / ^ , w • / 、 ' - f - 『，， 1 r 9"^# ^ w 

- 类似地，对于检验问 题：， 


Uo：ai > aWH a , a \ <(jl 


应取否定域： 

i 

W 0 = {F<C 1 } 

其中 F 由 （4.15) 确定， Q 由下式确定. 

▲ 

丄1 

fn x -un 2 ~i(y)dy = a 

v 0 


(4.20) 


1 1 r 7 
11( m 



由于 L 八-1，0 ( 3^)办=^，可利用1^分布表得到0 1 的值. 

J Cj ' 

数学上可以 证明：否定域 ( 4 . 2 0)是一致最大功效无 偏的. 
现在研究 o \= g \ 时的下列检验问题. 



(4.22) 

^^ - 5) 2 + 石(: y . -;) 2 

给定检验水平 a ， 怎样确定 （4. 21) 中的 C 呢？这就需要研究 
了 (看成随机变量）的分布. 

定理 4. 2设 Xi ， …， X ni 是来自 iV ("1 ， erf ) 的样本， Y \ ，…， 
Y „ 2 是来自 N ( M 2 ) 的样本，且（兄，…，；^ ) 与 （兄， … ，乙） 相 

-TT* 乂丄 - 1 — rntl -rA- 9 9 At ttL. —/r^* > I. b. / trt / a n n \ -ti* r4-» 

<y\ =(fi jfJLi =fji 2 的求 1 十「 ，现 TT® i 、火 At ⑷ ，兴 "T 

的 x , • v , 分别牴成兄 U 服从& +… 一2个白由度的 f 分布. 

, ▼ ▼ _ _ *■ , ^ J m 、 〜 t ， J , ~ ^ A. _ T LJ 9 ■ V P~ V ， ■，▼ ，▼ - ■ 

n l n 2 k 

证明••记 6= ^( X t - X )\ v = 由于（不，…， 

1 1 

X ni ) 与 d ，…，八 2 )相互独立，故(又， 0 与 （7,0 相互 独立. 根据 
第二章定理 3. 3,又与$独立，7 与!; 独立，〜 / u - l )， 念7〜 

X 2 U 2 _1)，于是 X ，$, F , 彳相互 独立. 从而 X — F 与$+7相互独 

、- 、 1 ， 9 9 9 »-> I. ■* r T y ' t I 八 ( 1 I 1 \ 9. \ 

SL. 3 "1 ="2 ，cn = 的 = 时’人 _ r 〜八 (U ， 

4(6+ 7) 〜尤 2 ( w i + n 2 _ 2) ，于是 
o 

1 f D 
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证毕. 

坦枢空现4 2.本 > 斗亦志右 r 难 E 

* • — 7 i—». ^ ■ r 0 »■ i 4 v ir ，； />*—■ 

P(\T\>C\H 0 )=a 
此时，否定域 (4. 21) 的检验水平是 a . 

否定域 （4. 21) 在直观上甚为合理.数学上可以证明，它是一 
致最大功效无偏的. 

例 4. 4( 例 4. 3的继续）问：70 ° C 下的强力与80 °0下的强力 
有无差别？ 

从例 4. 3知两个温度下的强力的方差可以认为相等，即 al = 
( 72 ，故问题化为在 d 下检验 "Ho = fJ . 2 . 

根据上面介绍的方法，应取否定域 （4. 21) .设《 = 0.、卯，现在 
wi = w 2 = 8,查 i 分布表（自由度为叫+穴 2 — 2 = 14)得 C =2. 145,根 

t r**-* f— K 1 L -• 一 A ¥li>f . t.i—t / »—» Av* I ^ A ^t=» 、 I 1=* 产 I ,▲ \Ut . /-»-«■ 、象 八 一 a -« 

mpjxmm it > 个奴诟（见例 4. w ， 昇恃珧 rr 重 i 的奴俚刀 z . ibi , 

因为 T = 2 . 161>2. 145,故应否定假设 H 。， 换句话说， 70 °C 下的 

• 、 

强力与 80 °0下的强力有差别，前者确实 大些. 

例 4. 5研究口服避孕药对妇女血压的影响.对某公司工作 
的35岁至39岁的非怀孕妇女用抽查方法收集到下列数据.有8 

I /士 to I—t art ^air -n* nHr r* t rr* / nr* \ AA ttT » n/r > AA M- 

八仗用口那 i 班子约，。八的皿 ni 、 HX 5 f 白卞巧但定 L 66 . etn 平1丛 

是 mmHg 柱），标准差是 15. 35;有21人未使用口服避孕药，血压 

9 ， . ■ 於 I t . 濾 1 - i — » 』一 _ ^ I . V #. i~t 滅八 ^ ^ A —* ^ \ . ■ ■ * ^ I # • 丄 饞 . ■ 於 t # -濾 1 - # # V #, 

的干将值是 1 Z 7. 44,称准差是 网：这 网枰皿压千； tg 值的差 

异是否“显著 b ? ' 

我们假定使用口服避孕药的妇女的血压(收缩压)服从正态分 
布 N(fXl ><7 i ') ，不使用口服避孕药的妇女的血压（收缩压）服从正态 
分布问题化为检验假设 Ho ：//,=//,. 

r , mm w ▼ r ~ ~ ■ w ^ w w - ▼ - — - r — - — — 

使用统计量 （4. 22) ，现在 : f = 132. 86,夕 =127. 44， n ! =8， n 2 = 
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n l 


21 ， ( jt , — x ) 2 = 7 X (15. 35) 2 , ^ (Vi ~ v) 2 = 20 X (18. 23) 2 ， 


可算出统计量: r 的值为 a 74,设检验水平& = 0. 05,查 r 分布的临 

▲ J * .'■■■! M ii f 癱 .* - t / ▲ j » j ▲ 纛 * 羞 . # - I ^ W ' I A A - J^. 八 ^ » J»-V f - / - W /、, j 1 >>~ ▲ 

芥 m 表知临芥 mA = 2：. UbZ. 观在 I 』 I = U. 74 <Z. UbZ. 既小恥圯 

桃刖 U 士而木估 子見基 兰見 

一 ^ u • ”r w/v r，g i i u=l/u m ^=\ ^rr • 

在的前提 Y， 对于检验 问题： 


Ho lfJL\ ^ JU 2 ^H a lJUl > fll 


府取否奋诚 


W， 0 = { (x l ， … ,x ni ,y l 




， 良. 

: i > c 2 


✓ j V 

C 4. Z ^； 


其中了由 （4. 22) 给出， C 2 满足 




c 2 


^-zCyydy 


a 


这里匕 (y) 桌 《 +自由度 '的， 分布的密度. 


可以证明，否定域 (4. 23) 是一致最大功效无偏的. 

类似地，对于检验 问题： ' 

Ho ：JUl ^ H a i fM 〈户2 

应取否 定域： 

、- W 。= {.(文 1 ， •“， '，： yi ， •“，： y ” 2 ) : T < Ci ) ( 4 . 24 ) 
其中： T 由 （ 4 . 22 ) 确定， q 满垒 、-‘ 

* •/"» 3 

”， •… 

尤 i +” 2 ——2 ( 3^ ) djy CL 

■； J -r-to 1 1 、 _ 

-*• ， 

HT "N7C 明不由祕广 /I 9/1、且 一 撕县 + Th 嫌壬伯 66 
uz* ^ j k^\ m^ry^i f i-i \ t ：* ^ \m m^ • 厂 

% 

现在研究 a \\ a \ 时的下列检验.问 题： 

L , Jlo \ l ^\ = JJiZ ^ H a ： JU \ ^[lz *. 

这就县著名的 Behrens - Fisher 问颜.此时难以傅用广义似然比 

， ■—■ ^ w — • ■ w ， - ~w • -w • _ ^ ~w w 一 ▼ f m ~w r ▼ f 響 ， ■ ▼ » — ■ 

检验法，我们采用下列解决方法.设不，… ，又 i 是来自 Nd / jt ^ al ) 

.V. . ... & V 旦求白的样★ 一样★祐五础古么 

m v I 丁 ， _▲ i n 2 卜 p=t 上， ，以 z / m j ;i~r y —丁 h 



n x 


Sx ,, y = 

l 


n 2 


办， 



si 


ni 



( X ,.— X ) 

、 - - i t - r 


n i 


SI 

— u - 


n 2 


2( u 2 


易知 


2 2 
0 \ I Oi 


X—Y 〜 AT 化一舛 ， 2 + 

V 721 


rio 


m • I _ I M ^ ■ ■ ' /I f I 、 'W -w ■ * _ _ t I |_ fcT.!'，t 

玄是在苓假坟 : 妁 = 舛卜，随机父重 


1 x-y 

[ q ± T ~?2 
Vm 


N(0 ， 1) 



可见 16 i 的值矢 大时应拒绝 h 。. 但义和 w 是未知的 ，$ 不是统计 
量.自然想到用 s ? 代替 w ， sr 代替午是应采用嬈计量 


1 


( X - Y)/^p + 



/ M 、 

C 4. 


«i n 2 

当I力太大时应拒绝 m d . 应指出的是在下： r 的精确分布相当 
尊杂 （而且依赖于比值 d/d). 幸运的崖，可以证明，在 H。 下统计 

M T 近他服从 m 个自由 度的纟 分布.这个 m 是与下列 m * 最接近 

« ^ 1 

JLL 士 A iltL. 丨 * K 

trj 罡奴 . 


m 


( c s 〗 十士 s 


2 


2 







(4. 26) 


«i ~1 V «i I w 2 _ 1 入 / 


利用 f 分布临界值表，找出临界值夂满足尸（ 111 〉 2 )=心于是当 

' T ， ） . ' ■ 

早仅当 m > A 时拒绝 h 。,: 川 | 

/ .类也 I 地，也可解爽 d 时如何检验的 问题. 

' 铜 4 . 6 研究患心脏病的父亲是否引起子女的 胆固龠 水平偏 

1 ! I '■ _ 、 y 

4 

-A* JLA. r、—I tnt xn ^t3Ct —4p- -1 /*\ /-\ 人 r\ -yr* -i a » I i JLA. / It . ✓ N, VA^. tt* —■— A DrV 

间 tfJIRJ 思! !• 腿饥调涅 ： J iuu ，|、乙王丄 4 夕的炫丁 l 共乂百 •夕匕丁七、朋: 

病），其胆固醇水平的平均值是 207 . 3 ,标准差是 35 . 6 ;另外，随机 

% • 薩 _ , M. - _ ^ ^ - m \ m W 丨倉 — ^ M. 爲 _ 一 ^ » 丨 ■ t # _ — ^、 ■ g j i M _■* _ ， • ■• 丨 ■ V ■ _ 

调歪 I 乂汞尤心胝舸史的 / 4 个 Z 全 14 罗的饯于，具胆回脬 7 ] C 干 

的巫抬估县 1 QT h 设难装县 17 . 前去的日 0 面胺 7 ^車的 

mw ( | 'Ty u=l 丄 vv , j . 7 kj »I i - i - >cn 7 I ， y •• rjM , 1=1 m ^ ptt " , j 、 i m v i 

值与后者的胆固醇水平的平均值有无显著差异？ 
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设父亲死于心脏病的孩子的胆固醇水平 X 服从正态分布 

^ 一 

■ I. ■■ jm 4k. -I ■■識 thk 办 iMfci, ^k. .^h Aadlflh 赢 -j. Jfca— m—• 'Ik ttKKttk A. ft 

N ( p ，<), 父亲无心脏病史的孩予的胆固醇水平服从正态分布 

NC ^^ l ). 这里参数 a d ， a ， d 都是未知的.我们要检验的假 
设是 H 。 ：；^ =/ i 2 . 

-^4* > i^t t dit ? s -ar A/e -rr ?. / 士 tun > 1. 曰‘ t ^ 。2 t r *2 vV m 。2 J>t 

目兀天 y ^ y 巧定 iff 守丁的 • 仗用沉 tt 里 *r = oi /) i ，込生 a 个 h 

絮分别是两个样本的方差 ，经过 计算知 F =4; 23. 利用否定域 

^ M m ▲ ft - _ ■ ft -— 9 — jk 屬 flhk —ft M >«Mk. _ — 

(4. 14). 对于 a = 0. 05,查表得 C '=0. 654 8， C ； 2 = 1. 549 L 现在 

广 dbfr riTl '/-?! -4 t 一 2 u 

丄 ， ^2 J HA , ^4 KA W y '4 C^l \ U 2 • 

为了检验使用统计量 (4, 25). 现东 X =207.3, 

^ v 碟 ▲ # tw » n«i •、- i . I ■ 塵 ■■ ■ • m MM* i ^ . 

1 = 193.4. 代入后和统计量 r 的值为 3.40. 、 

* 1 * 

从 (4. 26) 知 m * = 15.1. 4. 于是，在 H 。 下统计量了近似服从 
151个自由度的^分布.设 ^.975 ⑺是/个自由度的 f 分布的 0. 975 

mil -/r tT TT o / I ^ I ^ ^ / 1C1 、、 * A r\c +/ ril/r 田/* 、—— 

jj ULWi tyvj"pi n:o r -r v I i ,i ^ l 0 .975 v 丄 j j =^j* yjo. RXJim^r ua a — 

t 1 * - . 

^975 (151 X ^0.975 (120) = 1. 980. 现在 I T | =3. 40>1. 980,因而应 

' 、 ， • , ■* 

4a— 1 AA» r t _ tart 一 ■• t\ » 、 I \> rt»-i I~r"t j M . .1 * ttT JLZ* ttT X/-* -/-* _KL* If I- -V* 

mm rto t/JLl = JUt 2 . 即円以认万胆回醉 7 八但月並者 T 土左 

* * I 

异. V 垄于心痣中的泫芊的昍固醢水軍的羋抝倌碓宏低匙 1 

/ ■ ' ，、 W ，聲 “ /T ^ " V *>*"、 V " ¥ /-# ~^ !■-■-# / 鎊， I V | ^ I H ■/ N / 、 I ,、、丨丨 * - 

幢翥 - ■ ■ 幢 • ■ ■ AHM ■會 • ■ m * 

成对数据的比较 

右此免院问腼田的粉描且 qp 诚赤 对的 … " t 」， L 

rj - PM 、 1^4 MV MA . 4 /p AC , /、 ^ U \ 4 MV iV -^1 7^1 X 7 7 \^, n 7 jf n / y 

其中 A ，… ， x „ 来自某总体，: yi ，…，: y „ 来自另一个总体，但 A 与: y t 

tt 仝 b 2 1 I 曰 4 a -cr x 4 t 士 AA ^jx „ —— rv —— / m -to „ …丢 

^ m yv 7 B^m ± lox , al av ^ k 5 CLx z ="i i ^ yi =/ i 2 ^ yi 

成随机变量).要检验的假设是//。 ： 的=仏：怎么办？ 令 

I 9 f 

3^( i = l ，2,…， w ). 通常在实际工作中假定 A ， …，； 是来自某个 

， # 

正杰斗布 N (… — tt n . / t ^ ^ A^i ^ni 始- B }& ^ n . > d ^ ( iT 2 主 ^ n h 了 3^ 

■ ■ ■ >1 ^， _ 「 * ， 、 Lm. JL 卜 L 7 / p~» v ■•"•'J ~f I W I I —■ 、从 ' I ， / ，， y V -# 1-^- V «- 

H 0:< Wl = 和，可使用统计量 

4 - ； t 

■ •’ V 

' T =—^ == r , (参看（4.3)) <4.27) 

J Si 2 / n 

Y — / • ^ % 

这里玄 = 丄乏^ ， S 2 = —^― - Y ] (^ — z ) 2 . ^ | T | >c 时拒绝 H 0 ， 

n V w-lV ' > f ^ 

^ 1 o n 
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这里临 界值》 根据检验水平 a 来确定. 

、 、 ■ ㈣ ， * % 

、齄 1 m _ ■ • ▲ 1 % ^ 穩 ■■■_■■_> k ▲ .1 t V w _ . » \ i ■ 疃 ■ 丨 •• ^ 1 _& m - ■ ■ ^ *__ — i _ * 

例 4.7 为 r 鉴足两柙工艺万法对严品杲性能指你有尤显者 

性差异，对于9批材料用两种工艺进行生产，得到该指标的9对数 
据 如下： ' 


0. 20 -0. 30 0. 40 0. 50 0. 60 0. 70 0. 80 0. 90 1. 00 

0. 10 0. 21 0. 52 0. 32 0. 78 0. 59 0. 68 0. 77 0. 89 


问： 根据上述数据，能否说两种不同工艺对产品的该性能指标有显 

龜 1 1 t ^ k Ml 鑫赢 • 真 ‘ %. 

者性差并？（检验水肀 a = 0.05) 

解考査9对数据的差：^,…，％.使用统计量 （4.27) .查£ 
分布的临界值表得临界值 A = 2. 306( 自由度是 8). 现在统计/量 T 
的值是 1. 5<A. 故不能认为两种工艺下该指标的平均值有显著性 
差异. 

I \ t I . n' / >-f t-»_L —T* 人 —T- 1 -9r* XL t-l* TTTT 人 —T- XL i-l* 上 A* /tW ， rL 4^V 7t 人 》、~l FT3C 

以工识 1U 刈丁一您起、件、 l^rrit 你起 、件议恆瓶 I 口 J 越 i 


进行了比较完全的讨论.利用广义似然比检验法导出了各种检验 

^ ■ 1 f • P # » # I* —■ ^ . 1 * t tv 邊 « -V-% ft 囑 111* 9 身 ■■■ ▲ * 、 • t >V I-* A. # t V V v “ 

「口 J 题的具评宙疋域 C behrens - t istier N 题的否疋项隊外）这些否 
帘 诚钇廿 么白的粉 空藤 翁_+规右宜鈾作白杜 - 撕县 + Th 输 

/^― ^Lr i-i i—I mv ~^r~ »3 / 1 y u 7 y v Rr 口 /I、 i i i/u i-l* y v w 

无偏 （UMPU). 为便于查阅，我们把正态总体情形下的各种检验 

t ^ lBSi 格故始 44* 县沉木 Ofc&lfil 斗主>1 1 fcr 主>1 9 

ihjacs 、 n 卿 ％ M 里久 口疋令 = • 丄 —y >pc 

在表 4. 1和表 4. 2中一总体情形，兄，…，尤是来自 N ( M ， c 7 2 ) 

9 

9 

AA 44A -1- -^r- TUT M t-^ -nv ： T>r v H 士 〆 tivr/ 2 \ AA 44A -A- 

tTJ 汗平 ； 仕門 A3 、 件 1 百瓜， Ai ， …, 定木日 J\ Kfll , G\ ) 叼汗平 , 

V ..• V 且： sb ： 白 \T^ .. -2 、祕任士 V 2 ，〜 . 奶、且奶水白 rh 由 v 2 ZVt 

▲ 1 、 ， i 71 2 把小 1=1 i ^ v^t2 >a2 / OV1*r ^. 八 f n I 1=1 pq I3CA J4 

的密度函数， Kx ;w ) 是 n 个自由度 t 分布的密度函数，/(^〜，〜） 

曰占山 til ： 止 ― AA T7» 八 -h- AA dt^ tte .T^. 4 ^ T TA vin 士 二尤 r^t icft 白 

疋日 ni W n 2 m r yrw trj 往 n 叉幽双 • u 丄 vir 衣 /j、i^ 疋桃疋 


一致 最太功 效的， UMPU 表示否定域是一 致最太 功效无偏的. 


对于非正态总体，广义似然比检验法也是可用的.要注意，不 


县女菥右傕; V . 下广 V 4、〗钬 hk 給验法规杯 


例 4. 8 设 X 取值限于集合{2，一 2，1，一 l，0}，P(X = :r) = 
p(：rj)(0<^<l)， 其中0是未知参数，” … 
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零假设 H 。 


I 



----- - --------- T - * --- - - - - - - 

其中0表示 N (0，1) 分布的'分布函数： 








敷 的检雄 《一） 


自由度 否定域 


最优性 


MP 


X < Q 或叉>(^ 


U ] V(PU 


<C 2 


UMP 


Ci 一 fii 


\ (To / \ tTo 


\ ( 7 o f ^ (Jo 


4 n ^ = l — a 


UM^U 


> Cj 


美 _應 1 ■ ■ 烏 - 

jl f nj u 乂 —- a 


UMP 


CCW 或 

X 2 > CujI 




UMPU 


； n)dx 


UMP 


； n)dx = a 


(x ； n)dx 


UMPU 


n / … 

Kx\n)dx 

































目由度 


否足域 



l)dx = a 


最优饪 


UMPU 


9 

v \ 2 

K /12 戊 6 


^jm --. — ~m 

Ci<z < 


■BHBH 


UMPU 


T T1 iTT^ 

l)(Lr=a UiVir 


X <G 或 

x z >c 2 



(A 

Wr( 〒一 l)dr 



JMPI 



l)dx = a 


UMPU 


l)dx 



UMPU 


—1, n 2 — 1) 



fix\ri\ — 1 ，打 2 — Ddx 


UMPU 


r c i 


P<r^ r^, 

▲ 、 v i 

F>C 2 


f(x ； n\ —— 1 %rii —— l)dx 


m oo 

f ( x ； ni — 

J CL 

' ~c 



l 9 n 2 — l)dr 


« ( 近似 ) 



——— W ■ 


IMPTT 


( 与 m # 最接 
近的整数） 



2) dr 



UMPU 


)dx 



t. fc. ，奮 、_ 

牧阢 


;m)dr 



较优 

























a 


工= 士 2 


/>( 工， 0 ) = 一 1 — 2ct 


士 1 


(0 C 9 




, p ( x 9 ff ) 


~ a (\~ a ) 




-2 


+ 1 

I — 




/1—— n \ 

\ 丄 — a / 

、（1 一 沒） C ， 


( 0 « 9 < 1 ) 


其中0< 


a < J f 2 ^a 


<C<a. 


研究检验问题 


H ox d=O^H a ：0 <d< 1 


为了寻求广义似然比检验，先计算广义似 然比. 设样本是兄 


k 忏平重定 1)， 厂乂似然比为 


A ( x ) 


cun 

^-41-/ ix 

_ 0 << 9<1 


P(JC 


p(x 9 0) 


易知 


AK 6) 


1 C 


rrj \t ^ Ct 少 \ 

囚万 \ I J 


(—9^ 

x « / 


2 C 


A ( l ) = A (— 1)=- 


-C 


飞，丨％ % 

AK^JJ 


1 -C 

1 一 a 


水平是 a 的否定域为 W = U : A (: r )> A 。}， 其中 A q 适合 


P(x l ew 0 \e = o)= a 


4 


易知取 A 


-i 

丄 一 u 

l—a 


时 
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P(A(Xi ) > A。I H 0 ) = P(Xi =土 2 |^=0) = a 
故否定域是，。= {2, 一 2}， 功效函数 

i 

\ 

P(x(Xr) > i— ^ 沒 ） =0C+(1— 仍 C 

\ 丄 一 a / _ 

=n n (n < r ^ o i 

可见这个检验法不是无偏的.下列检验法更好些，取否定域- 

/ n \ Bft 业口 —— r\ n- 4 * -ter ith. TJf 、 

W / ，即二 UtLTX 二 I 1 — w H'j : m 牙 1 n 0 . 

itPJ^t PCX, GW, I0) = *C0,0)=^ 功放函数 
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P(X, e^il^)= p(0,d) =a'>a (0 < |9<1) 
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此检验法是无偏的. 
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作为本节的结尾，我们指出 F 分布甚应用极广的分布.除了 
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在正态总体的检验问题中常用到 F 分布外， F 分布的分位数与0 
分布的分位数有密切关系. 

引理 4.1 i 奋 X 与 Y 相互独立且 X 〜 f ( m )， Y 〜/(«)，则 
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证明： 令 v = x + y , 直璋计算 a /, v ) 的联合密度，不难推知 lt 
的分布函数正好是上述的 〆 x ; 竽 ,4). 详细叙述从略. 
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位数，则 
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证明：在引理 4. 1 中取 m = 2 K 1 ，w = 2/ C 2 且 


^ r ( K lf K 2 )=(l + 

\ 


一 i 


(4. 28) 


F 


tjt •% r 

八 2 A 

K , Y 


则 


U = 


F 


K 


K x 


+ F 


且 F 服从自由度为 21^,21^ 的 F 分布. 于是 
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由此可见 
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故 （4. 28) 成立. 
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公式 （4. 28) 是很有用的•设 X 服从伯努利分布， P(A = 1) 




/>= l - P(X = 0),0< p < l , X 1 ,-, X 7I 是 X 的样本，从第二章例 
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3.3 知的 y 水平置信下限是上（^足），这里 £⑻=0, 
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所以可用 F 分布的分位数表来求 /> 的置信下限. 
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*§5 临界值和值 


前面说过，给出一个检验法就是要给出一个否定域.否定域 w 通常是 


由一个亘观上有明确意义的统计量 pd ， 釆确足.确足的万式叫概 


括为两种. 

第一种(单边情形）： 

W = { (xx , ••• , x n ) :〆 a ， … , x „)> A } (5. 1) 

第二种（双边情 形）： 


W = { ，… 9 x n ) xipKxi , ••• ，: c„)<Ai 或 < p ( x ] ，…，: r ”）> A2 } (5. 2) 

这里 A 叫作单边情形的临界值， Ai 和；1 2 叫作双边情形的临界值.临界值是 
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sup 巧（9(兄，… ， X „)> A ) =cr (5. 3) 
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于这个 A ，（5. 3) 式表明否定域 （5. 1) 的精确检验水平恰好是 a . 

当满足 (5. 3) 的 A 不存在时，应选 A 满足 

sup P 0 (< p ( Xi ，… 9 X n )> A )< a^sup P e ( ip ( Xi ，… ， X „)> A ) (5. 4) 
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此时，否定域 （5. 1) 的检验水平不超过 a . 
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对于双边情形应选取 ； U < A 2 满足 


sup 巧（9(兄，… , X n )< Ai -) = ^- (5.5) 
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对这 样的; U ， A 2 ，否定域 （5. 2) 的检验水平不超过 a . 当这样的&不存在时, 
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当这样的；1 2 不存在时，应选取；1 2 满足 

sup P e (<p(X x ,… ， X„)>A 2 )<+ 
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此时否定域 （5. 2) 的检验水平不超过 a . 
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简称临界值方法.这是本书用来确定否定域的基本方法.读者容易看出，前 
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我们指岀，还有一种确定否定域的方法—— P 值 方法. 该方法可提供人 
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先研究单边情形的否定域 (5.1) .设 x ?， …， x °„ 是样本值（已知的 n 个常 
数).令 

p ( x°i ,••• , j ：2) = sup P ^ C^CXi ,••• , X n )^< p ( x°i ,••• , j ：°)) 4 (5.9) 
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这里“托0。”就是零假设 ffa ./ KM ， …， k ) 是 h q 成立时统计量取值不小于 
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定义 S.l /> U ? ，…， W ) (由 q . 9) 定义）叫作单边情形下样本值 U ?， …， 

M ) 的 户值 • 
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引理 s . l 设对给定的 (0,1) ，恰有一个 A 满足 
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这个引理告诉我们，在条件 (5. 10) 下，样本值 U ?， …，、: p °„) 落入检验水平 
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样本值的/ > 值小于 a 时拒绝 H 。. 即否定域 （5.1) 可表示为 {(&， …，工„): 
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的优点 在于： 不预先确定检验水平 a ， 从计算出的/>值知道，对一切大于这个 
夕值的 a ， 则拒逄 H 。 引起的错误其概率不超过 a . 

夕值 /»( x ?， …， 4) 也可看作是样本 (* r ?, …，工°„)与零假设 H 。 相容程度的 
度量.值越大，相容程度 越高; 反之，/>值越小，则相容程度越低./>值小到 
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A ， 则有 e >0 使得 < p (: r 0 '，… , j ： S ) — e > A . 于是 
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X „) 是离散型随机变量时常出现这种情况）.此时应考虑检验水平不超过 a 
的拾賒.我们可椎广弓 I 理 5] 1. 、 
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引理 S . 2设对给定的 (0 ， 1) ，有 A 满足 
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则 9 U ?， …， 4)> A 的充要条件是 
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证 明：设 9(3, …， d )> A ，则 
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反之，若 < p (： r ? ，…，: r 〗 XA ， 则 
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从引理 5. 2 知，若 A 满足 （5. 11)， 则否定域 W ={( x l 9 - 9 x n )：< pXx l9 - 9 
&)> A } 的检验水平小于 a ， 而且样本值 U ?， …， 4) 落入 W 的充要~件是该 
样本值的/值小于 a . ^ 

例 S . 1设 X 〜 mju ， cr 2 )， c 7 未知，检验假设 H 。：^ o . (备择假设是 Hi : 
^>/ io ). 此时应取否定域（参看 （4. 5)) 

W = { ( xi ，…， j ： rt ) :9(工1，…，工 rt )>又 0 } 
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根据样本值: r ? ，…，我们可直接计算/ > 值： 

pCx°i , ••• yxl) = sup P ff (99(X1 , ••• ,X n )^(p{x\ ,••* ，工 2 )) 
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这里 0= ("， a 2 ) ,0。= {(/ i , a 2 ) ， tr 2 > a }. 
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p(jo°i ，…，: rS) = i% Q ， ff 2 (T^(p(x°i ，…， 乂）） 

这里 T 是服从 _ 1 个自由度的 i 分布的随机变量.因此，…， Z ) 可以 
算出.从引理 5.1 知，当且仅当这个/>值小于 a 时拒绝 H 。. 

例如，为了检验假设 H 。 #<25,根据样本值 x 0 " … 可算出王 =25. 9, 
S 2 = 17. 3.故 < p ( x 0 '， … ,^ 4 ) = 1. 731. 可计算出 /> 值 


p ( x ] , ••• 9 x°sa ) = F ( T^L 731) = 0. 044<0. 05. 

取对卞恆狴不千 a =0. 05应拒钯 H 0 . 

现在来研究双边情形的否定域 (5. 2). 我们不去具体确定和；1 2 ，但从 
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义2. 设: r ? ，…， Z 是样本值，当 < p ( jo°i , ••• » x 2)^ Ao 时令 



„0 、 -:— / o __ D / „ / v … v 

丄 n ， — iiiui\ r e \w\yv\ ，”- ，八 

a • 


eee l 


o 


^< p(xi 



当 9(: c ? ，… , xS )> Ao 时令 



/)T r? 

\ 1 



i 2.<；lin P» ( rn( ^Ct 

V — ^ • IT ' — 墨 I 


托 0 O 


rn 

T 


、• — i 



^ cdCx ^ ，…， x 2))， l 丨 (5. 13) 
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込生 c/t (Wo 定爷 假议 n 0 . / 

定义 5.2 由 （5. 12) 和 （5. 13) 定义的 A ( X ?， …， H ) 叫作双边情形下样本 
值 ( x ? ，… ，: eg ) 的/?值. 


户值的重要意义见 J 列引理. 

引理 S .3 设对给定的 a 6(0， l )， 有唯 一的; u 和唯一的 A 2 满足 


sup P e (< p ( Xi , •••, X fl )< AiX - r - 

托 e 0 L 

^sup ，…，又 XAi ) (5. 14) 

_ v 名一 - - ■* 

抑0 

sup P, ( 9 ( Xi , - , X„) > A 2 ) < 
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则、 （ x?， …， d ) < A ] 或 < p ( x % 4 ) > A 2 ”成立的充要条件是 
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p \^\ 9 ••- ，丄 n J ^ a . 

证明：设9(工?，…，工 2 )< Ai ，则 〆：?，•••，: XAo (这是由于 A 。 6 [ Ai ，又 2 ) )• 
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于是从 （5. 12) 知 
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从 (5. 15) 知 9 ( j :? ，…，: ）> A2 . 因此，只要户 （ x? ，…，: rS ) < a ，则一定有 
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引理 5. 3 告诉我们，为了检验假设 H 。 0 。，否定域 W ={ Ui ，-, x n ) t 

cp ( j：i ,…， < r _ )< CAi 或 6 o(：ri , …，: r _) 丨的檢脸水平不招 i 寸 a (有时检脸 TlC 平 
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恰好是 a ) ，而且在引理 5. 3的条件下，样本值(: r ?， …， W ) 落入这个否定域的 

«■ 

充要条件是样本值的/>值+于 a . 这种用/>值来确定否定域的方法仍叫做户 


值 方法. 


双边情形下/>值方法的优点与单边情形下/>值方法的优点是一样的. 


兹不赘述. 
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值.有时这种计算还相当复杂.耔在 一 i 常见的假设检验问题里，/>值的计 
算程序已在流行的统计软件包（如 SAS ) 中给出.使用这些软件容易算出 
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例 S .2 设 X 〜 翅未知，为了检验假设 HoW = dU 已 
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知），前面说过应使用统计量 〆 兄，…， 当史值 太小或 

Oo 1 




1 nr 

lOD 





# # • 


太大时应拒绝 H 。. 故应采用双边情形的否定域 


W ^= {( xi ，••• 9 x n ，…， 或 < p(xi , 


9 X n J^A2 i 


如何计算样本值(: T ?， …， d ) 的户 值呢？ 

i 

从直观上看，如果 H 。 成立 ，鲥 应该和1相差不 太大. 故在 

71 一" 1 

W 的表达式中 Ai 应小于 n —1, A 2 应；手 n — 1. 取 Ao = n —1. 则 Ai < A 0 < A2 - 

' 1 A ‘ 一 

注意 ， oCr ?， …，的充要条件是 S 2 <d •这里 S 2 =—- xn ) 2 

- M ■- ，■- "W - ' ▼ ■ V #r —一 V ^ ^ M ' , • ^ 

n — 1 ^ k 


/_ 1 xA . \ 

(々=亡 2> U . 

“ 1 

于是，从定义 5. 2知 S 2 < g 时 

* 

* 

/>(工？，…, j :^) = min {2 sup P e (< pCX " … ， X n X<po ),1} 

这里 0 = (“， a 2 )，@n = {(“， tr 2 ) : U 任意， tr 2 = d } ，(^ =©( i ? »••• , xl ) 

, ^ ^ ^ w - ▼ _ 廣 ^ ^ ■— 

易知夕(4，*"，4) = 111111{2户« ?) 0)，1}，这里随机变量6服从《 — 1个自由度 

的 X 2 分布. ' 

类似地，当 S 2 > d 时 

p ( x \ , x °„) = min {2 P (.^< po ) ,1} 

( f 及 99 。之含义同前). 

根据例 4. 2中提供的10个数据，知 

1 = 7R 7 fid. /t?. 

• V • I V *, \^\J J 


10 


9> 


' ' 


.0 


乂 0 


0 . 


yjo 


P ^>< po ) = 0 . 30( 因为$服从9个自由度的; C 2 分布）.于是/>值= 
见对 匕切 a < 0. 60,在检验水平 a 下都不应拒绝假设 H a 。 = 64. 


0. 60.可 



比率的假设检验 

•ki 


设 X 服从两点分布（伯努利分布）. X 取值0或1且 P(X = 
L)=/>=1 一 P ( X = 0 ), 这里/>是未知的 . />就是所谓的“比率 ”. 
当 1 表示成功， 0 表示失败，/>就是成 功率； 当 1 表示有效， 0 表示 
无效， P 就是有效率. 

^ io /^ — 

• 1 O 0 • 



先讨论一个总体的问题.此时，对/>的假设检验问题主要有 

' . S 

卜列 三个. 

( 1 ) H 0 ： p< ： po^H a ： p>p 0 ， 

(2) H 0 ： p ^ po ^ H a ： p<po 

M 

(3) H 0 ip = po ^ H a ： p ^ p 09 - 

这里是要检验的零假设(其中/>。已知）是备择假 a . 、 
首先讨论上述问题 （1). 设X的简单随机样本是 ，…， X B , 
如何检验 Ho :/)</>。？ / 

很自然想到/>的估 计量/ ==丄^兄，当《较大时 j 应与/>很 

n 1 


_进.当 f 比 A 大得多时应拒绝 H 。. 4 S = 公 X ,，故对淦的;2, 

• ，、 、 1 » > 

当 S 足够大时应拒錘 H 。. 所以杏定域是丨(名，…， xj : f ]' xr > c ) , 

其中 c 是临 界值. 设检验水平是 a , 取 c 为满足下式的*小 整数： 

) 、 ： ' * * ^ 

_ n / /? 1、 

sup r fi Ko ^ cj^a ^ vo •丄/ 

. p<p 0 , .•‘ 

W m n / A \ -=fr Z=1 M /-!* AA 曰 L rt-l* ItU A A^t 4t0t 

返生厂 /> 、八 , 衣诊双疋 p 口 si 爭 rr 八们网平 • 

注意， S 脈从二项分布♦即 

* * 

/ /"! • \ m i / * \ wf — 4 \ 

= U —• • U = U ， 丄 ，•“， W 


n 


于是 p p (s ^ k )=^ T . c ^ a - p ) 


n~t 


k 


n\ 


(k-l)\(n-k)\} 




p 


u 


*-i 


n — k 


au 


o 


c 々> i ， 见第二章） 

由于 PpCS > 是)是 /> 的增函数， （6.1) 化为 

^ Po ^^c)^a .(.6. Z) 

我们不去求这个 c (满足 （6. 2) 的最小整数）而是另想办法判别事 

f 

Ai V J - —. -jm. — __ 識^ 一 »u —rfhfc A %&. ft m -jm. _ 

件 “ S 彡 c ” 是否发生.设样本值是 W ， …、, x u „( w 个已知数）•令5。 = 


n 

显然，从 (6. 2) 知 S()>c 的充要条件是 




2 ^npQ (1 — Po ^ 1 ^ a (6.3) 

I = J 0 

设方程 i 

Y ^ Cip ' a - p )^ = a (6. 4) 

i=s o 

的根为久(知）（知>1).此外，规定 Ar(O) =0. 易知 X/> a (5。）. 
故当且仅当 A»(s。）^/)。 时拒绝 H 0 : p ^ po > ‘ 

怎样计算久（&)呢？有下列公式(参看 (4. 29)): 

p a ( s 0 ) = ^1 + - ~~ ^ Fi- tf (2(n _ s 0 +1) 9 2s 0 )j (6. 5) 

; «l 6. 1 一种广泛使用的药治疗慢 ft 支气管炎的有效字是 
0. 幻/现在一家制药公司'推出一种新药，声称 :治疗 懂性支气管炎 
的有效率高于 0. 80,但药价比广泛使用的那种药减少吗 &之 一• 
为了验证新药的有效率是否高于 0. 80,收寒了临床试验‘据.从 
使用新药的病人中随机抽査 T 30人，其中27人有效，3人无效. 
问： 能否认为新药的有效率高于 0. 80? 

I T » r 1 M -«*-* * * ▲ r ■， * I / / _k^.t Inrt -W V — _ -— * _r A -- 

m 用 A 衣不使用新约的双朱 . A = i 表 7K 句双 ， A = U 表本 

无效.现在样本量 w = 30,样本值乏和& =27,设检验水平 a = 
0.05. 从 （6. 5) 知 

A* (5。 ） = />o.o5 (27) = f 1 + t ^_F 0 .95 (8,54)) 

\ Li f 




4 

27 


— 1 


丄卞 = 入 2. 丄 3 


U. /0<^o=U. 8U 


故不能拒绝付。：/></>。，即没有理由说新药比旧药有更高的有 
效率. 

顺便说一下，若30人中有28人有效，则可计算岀 Po . o 5 (28) = 
+ l =0： SU >^. 故要拒绝 H。， 即可认为新药 

V — m | v ■ W *■ ■»- 琴 w ■ ♦ «»- jr- ， -w ▼ ， ■ ― 

乙 0 / 

右审高的右放索 

I "V I 豸 | • 

现在来讨论假设的检验问题.设；^，…，是简 


• 138 • 



单随机样本，很自然想到，当 s = ^ X,太小时应拒绝 H。• 对给定 

' 1 

的 《G(0，1). 设(:是满足下式的最大整数. 

_ d /c〆 一、〆 ▲ fa 

• »up r p j v v / 

p>p 0 

TrrrwJiTr 口口 n 曰 i A/t^ .ts 工曰 cWU 本 

nj kA UI：^ r p 、 o\Lj 疋 p WJ Vm mXH ^ J 7EVU . uy puyv 

P Po ( S<cXa (6.7) 

-fix / >-t -r- -U -Ulx 1=1 /-X* 410^ Air Ta=r B □ 4*1=1 -U >4 - >kif 口 il “ _ ” 曰 

双 iud、 太守 ： pc c mi 兵件戮但， iiu 定力 ® 、夕 j、 広外力 y 。义 c 疋 幻’ 

发牛.仿效前一检验问颜的处理方法，设样本倌是X ?，…，令 

r~ f ^ p ^ 酽 - 'V ^ ^ ^ - ▼ r , , w , — T - 

- > 

n j 

fD = XI 不难看出 S 0 <C： 的充要条件是 P，。（S<5o)<a， 艮 P 

1 - ' ’ . •_ 

5 0 、 

y^.Qpp (1 — po )^ 1 ^ a 

i = 0 

这等价于 

n 

y^j O n po(l — />0广 1 ^ 1 — a 

i = s 0 +l 

设方程 


n 

\ 飞 /^f • i / • \ it—r _ 1 

Zj 以 —P 厂 =1—0 ： 

i=、+l 

的根为汉 U ). 于是 5 o <C 的充要条件是1(5。^</> 0 



所以，当且 


仅当孓 U )</>。 时应拒绝 H 0 ： p ^ p 0 . 

怎#计算多 a ( 5 。）呢？从 （6. 8) 看出，多 a G 。） 是贝塔分布 /?( x ； 

， « 

5 0 + l ， n _ s 。） 的 1— a 分位数，于是 

* = /i 4-^~ 5 °- - -、 1 ( P , Q 、 

I ' 5 0 +1^- # (2(50+1),2(^-5 0 ))/ 、…… 

分 B9I7 /„ « 、且 i!bii+r 由曰 一 Ah 17 ZV-ftr iVt 1_ ZWA 来 W 在 

込王 ^ i- tf vA4i ，"2 v 疋 « 印戊疋汀 1 ，以 2 卩 y f : a/ im 卩 y 丄 a yj ulsplk^ 

看 （4. 28)). 

-Ctn - A - -dr TTt T T ^ 1 AA 4^ ilA . n mt ? _5 ，L IT 、ir 日 AA A 4 m £: 

视 11 ：不肌九 n 0 : p\—po wjmmmm. 汉 Ai ， … ， A rt 定 _ 平呢 


n 


机样本， S = J ] 足. 显然， S 太大或太小应拒绝 H 。. 对给定的检验 



水平 a ， 应取最大的整 数 q 和最小的整数 c 2 满足： 

# J 

Pp ^ S ^ c . Xf , Pp 0 ( S ^ c 2 )^f 

n 

、 M |. \ A t . 倉 2 鑫 >—t f\ r\ M \ 飞 r\ ■ 九 _ - » m , . m ^ 

议枰平值是 Xh …， X ；；. 令 So = 小难看出，知的无要条 

1 

% 

Up (\<r SL o \广 Ahit^m r > r \<^ zp 

I 届疋 i p 0 2 ， yU 3 C 7 TN IT/t J p 0 \ ^^^0 ，'^ 飞、 4 

曰 - / ▲ AM 女 At M* 曰 7T / _ 、 l / ▲ / ^ rv \ \ - _ AA 々冰白 

疋 〜 >ti tVJTU^^lTTBPf ySoJ^Po K^m VO . \J) ) jS 0 ^C 2 ffV 求 IT 龙 
*« (.or m ^ b 4 v ^7 ia ^c h . 请去仏 r ^> 

JT~2 Xfc，u r ^^ /^U V is^ '« V v* V ，， 7 - ， /U 1 里 J. tyv /^,-S- \vy X /^u ^^ 41=1 ^ ^ : 

Po 时应拒绝 H 0l p = p 0 . 这时检验水平不超过 a . 

K f 

棚：?4：也7® 必而木 tt 7女66 坊 iTHlBf Y t ? V 知 TT 她 tV 被 BB 

</U M-/T- 吹 1 夕 Li r，；I I m wv J^g AC 2 i* 认 —y 乂 '| 口二一^赘 Tl^/jpt 

从伯努利分布，尸(叉=1) =/>i =1 — P ( X =0) 9 P ( Y =1)= p 2 = l — 

r >， v = n 、為 -a 格 土 An i '凸 v 古你 M 找执进士 v ... v v 古 

乂 \ j. ^ / j y\ ^ y2 1 小 / ， toe /X inj 干 rmayiiTT^n ^ l ， , ^n x ，乂 

简单随机样本 I ，…，，考虑下列三个检验 问题： 

Lb 

(4) Hoipi ^ : p 2 H a : pi p 2 

(5) Ho lp \^ p 2 4 r ^ H a lpl <, p 2 

(6) Ho：pi = p 2 *-* H a : pi^pz 

这里 H 。 是零假设，是备择假设. 


n l 


n 2 


八 o — \ 飞 v o — X ^ \r mir i Srt i A/t/40 丄且 /V 口 il 曰 1 

/ j — / P \ TH Pi 0、 J'l 口 H 里: TT 刀 U 疋 Pi 


ni 


p 


p 


S2 

n 2 


i 



白妖相 511 .劣 kk 士 俱名时 命柘餡 

• I—I 7 \\\ ^Ui 、 0 ^^ ■ 1 iT l 卜 u iT ^ / 、 1^ -4 u • JT 丄 JT 厶， - 1 

. ， 1 、但金 Rrf rtriP 桃 tJ . ^ ^ . ^4 ^1. t? ^ 

z ， j ， 1 叮少 h j/ uci ^ 0 ; jKI yz f =1 y i y z "i m -dv xv m-j ； j^ 


拒绝 Ho ： pi = p 2 . 

基于上述思想，我们给出两种检验法.一是正态理#方法，这 
是大样本情形才能用的近似方法，另一是 Fisher 精确^验法，各 

I ^ 

种情形下都可以用，但计算上比较复杂. 


八 A-rt -T- —*-* -rfwt 、人 、 . 、丄 口 A*" t r / , ，、一 

尤） r 坩止忿;^化力 vari,pi — p 2 j = 


n x 


. ✓ 1 _ . \ 

^1 V 1 — pi ; 



>( 1 — 九).令 


t a r\ 

l^U 



Pl—p2 — (pl—p2) 


Ji 

l < 


^( i - A )+^ 2 ( l ^ 2 ) 



( 6 . 10 ) 




Pl~p2 


(1 — i ' ) + —^9 (1^* i ?) 

a ^ M * ~ a m ~ a w ~ 

ni n 2 、 


( 6 . 11 ) 


Pl~p2 


浐 / I 

v /( f - 

V \^1 



ni / 


) p ( l — p ) 


( 6 . 12 ) 


n ， 


n z 


这里》 1= [?U 2= G ? Yi ， 


P 


ni ~rn 2 


▲ A 

(riipi +n 2 / > 2 ) 


数学上可似证明，当〜和 7 t 2 相当大（一般要求 
» 2 沁（1 一沁） >5) 时，随机变量$近似服从标准正态分布 .. 给定检 
验水平《，设 A 是标准正态分布的《分位数，则易 
知在 />1</»2‘的假设下 $>1；，更有 •于 

是时拒绝片。：灼<九；当7<力4时木拒绝 H 。. 

.. 类似地，在 九彡夕 2 ,时，从而尸(7<0<尸(6<0土 a •于 
是当直仅当 rj < z a 时拒绝 H 。 : p 1 > p 2 . k 

可以证明，在 p 1 = p 2 的条件下，只要 A ，〜相当大(一般要求 
ni pi jn 2 p 2 (1 _ >2 ) >5) ，统计量 f (见 （6. 12)) 近似月 R 

从标准正态分布，从而 P ( I f I 当且仅当丨 f I > A - f 时 

拒绝 H 0 ： p 1 = p 2 . 

. r . 

例 6. 2研究口服避孕药对年龄在40至44岁的妇女心脏的 
影响.收集的资料表明，在5 000个使用口服避孕药的妇女中三年 
内出现心肌梗死的有13人，而在10 000个不使用口服避孕药的 
妇女中三年内出现心肌梗死的有7人.试问 ：口服 避孕药是否对 



妇女的心脏有显著的影响？ 

解用九表示年龄在40至44岁的妇女由于口服避孕药导 

% 

致三年内出现心肌梗死的概率,/>2表示这个年龄段的妇女不服这 
种避孕药但在三年内出现心肌梗死的概率.我们要检验的假设是 

r t t — * kt 垃 /m jrL b tt •上 t 

n 0 ： p l —p 2 ，甘评 1R 议定 n a : Pi -YP2. 

使用统计量 (6. 12), 现在 
r - = 13 、 _ 7 

夕 1_ 5 000, p2 ~ 10—000 


- 13 + 7 

t > = - 

"15 000 


由于 nipi (l — pi ) = 6. 66>5，；1 2 石2(1—>2) = 6. 995^5. 故可用正 
态理论检验法.可计算岀 f =3.01 .设检验水平《 = 0.01，查表知 
z 1 _^ a = z 0 .995 = 2 . 58. 既然 f =3. 01>2. 58,故应拒绝 H 0 ： p 1 = p 2 f 
即可认为口服避孕药对40至44岁的妇女心脏有显著影响. 


现在来介绍 Fisher 精确检 验法. 此时对样本量无任何 限制. 


矗 », 


无介紹探作万法，然庙介绡这个橙骏法是基于何柙统计忠想珉导 

出来的，仍设不，… ，尤 i 是第一个总体的简单随机样本， I ，…， 
是第二个总体的简单随机样本，九和九分别是两个总体的参 


来 fr 人 工 n 1 4 -s^r /rrt O _ 

TH P2 ^ ^>1 ^ 



n z 


V C * — \ ^ \7 
八 i ，口2 — / A 1 ! • 


I 


设两个样本的样 


-X- /=fcr / V 1-til ㈡ n n n 八 

牛诅芩别定： rr ， •” 邳 w ， ••.• 、 y \ 、，令 


n 2 

a. ^ rv i-w 

s u i = 2j^^2 = 2^ y % t = s \+ s \, 

i i 

为了检验打。 ：/> i < / >2( 备择假设是 H a : pi > p 2 ) y ^ 


PiisD — » 

0 

X 


这里 


(6. 13) 


(6 - 14) 



p(i) 


\ i f \ t-n 

rii +n 2 




0，1 ，…） 


(6. 15) 


对給佘的拾胳永巫 〜 劣日仿劣九 时拓餡 R . 

，/ >* — V I^U ^JLIX . 、 I 认 7 1 ■•-J__ 1 1 \ v 1 ， P 4 ^1—-^|«i 释 • JT I ^<JT # 

' * < 

为了检验备择假设是 H al px<p z )， 令 


/ A 、 X. i / • 、 

PlKS\)= ZjP^ l) 


✓ J% -4 A 、 

Cb . 丄 b ) 


( ti ( tS IP . ( fi . 1 、針▲会奋的給 ■胳 7k 平^ /> . 劣日 iv y>o ^^ 

V ^ W V ^ ^ — v X X • ，，V V 1-1^ ^JUZU ，鏽， 面 ^ 7 4 ,.,,1-A^. - 1 v 1 / 

* 

a 时拒絶 H 0 ipi ^ pz . ' 


为了检验 H q : 灼 = 九（备择假设是:丸专九)，令 

* 

• 4 

/)o ( k ? ) = /^mifi ( % 1 *Y /^ . N ^ i }( 1 

JT O ' v 1 ， — \ / J JT ' 一， ' / J JT ' 一， / 


rfi . m 




i ^ s . 


则对给定的检验平 《, 当且仅当/ >3(S?)< a B 寸拒绝 H Qi p 1 =p 2 . 
上述检验法就是 Hsher 精确检验法，其中“精确”二字的含义 

是，这个检验法的检验水平保证不超过给定的复杂之处在于要 

» 

计算各个/>(〗），在实际计算时要初用下列递推关系式：当 p(O^>0 
时有 


» 

9 


p{i-\-l) = p(i) 


✓ • 乂 〆 - • \ 

VWi ^~ i)Kt — p 
(/+l)( 7 i 2 — £ + 芝 + 1 ) 


j 

(6 - 18) 


这个关系式根据〆〗）的定义甚易验证其成立.后面还要介绍实际 
工作中采用的列联表变换法，用于计算所有的 pao. 

现在问 ：上述 Fisher 精确检验法是基于什么统计思想而导出 
的呢？沿用前面 的记号 ，数学卜可 以证明 ，如果假设 

▼ , ■ ， 》 _ ' ，丨 ~W W ■，- ▼ ， ■♦- ^ 严 ▼ ▼ ■ ■ ■»■ ▼ , 产 丽 -— • • - w - V ■— Jg 

成立，则在 &+&=£ 的条件下 ， Si 的条件概率的最大值是 


y^/> (0 ，即 


①(厂)就是组合数 Ck •当 C > m 或 f <0 时规定 (7)=0. 

-fir% 

• I 4 J • 



sup P h ^ Oc I Si .+ S ^ = t )= (6. 19) 

* r \ r 'L 一 — • — A 

, P\^Pt t = c 

这里 (A 1^+52=^) 表示两个总体印参数分别是 p ,, p 2 时在 
S ,+ S 2 = t 的条件下事件 A 的条件概率,的定义见 (6.15). 

I ' « ^ * * 

/ n 1 W 、 AA Ml. ) 7 T O 口 士士 X It mJ& /A ^ / r\ 1 \ )/L B Mfc t=l 

VO . 丄 y / trj 5 KX / 子 TiL %： EJCTC ，/ An &. 5 o/E atrVU ， l>N 汉 c / EiW/t 

** 

* j L 

^ • :. \ > 1 

的暑 / l \ 轎 011^ S , +孓 =/ 的备件下 S , 计庙拓 

/ £ X ' - , w-^ ^ ， a r~- w ， I -■ ■* — x *• — ii ， Y ，，、 I I * — i 一 • ■ ， ' “ _ 

i=c ' 

祕 〆 乂 吐杳迫捉 进 *估 … 个 o ”o … ',o u ra 

^ a o :尸 1 ^ 广 2 • m - 〆 広 、，I 队 w ^ rr，"tr 出 + i ， 7 ^ n i ， Ji ， J ^ n 2 ，"、 、 v 丄 

知事件 “s , + S 2 =^ 已发生，而 > c” 当且反当 O c 时发生， 

V • 

1 , .* 

JwK n 、 上 J ■ - ■• Jt -* / » i _ b ✓ r » 、 y ✓ £ 八 - ■ n . n . 丄 L■—t Ar -# 、 f / 

並热 S \ ^ c 时咒安汆忏定 / MUI ) (蔘有 d 人既彐丑仪彐 

‘ *, / • ' 

多1 (O < a 时拒绝 H 。 ：九< / >2,，这时挣验水平不超过 a . 

类似地，数学上可以证明 ； 


眾 〜 2 


• K 

( S^cl Si + S 2 = i ) = 


* 


t 


-. jT* * * \ 

给定 (0，1) •设 c 是: 满足文 >(/) < a 的最大整数、从 

• 、， i = 0 - ■， 

/ rs i /> 、 A*i-t n JLt* —>r - jjs /aL. ✓ n v 丄 、 f/ I - r /i-» 、 l/ ✓ ft 、 -- 

、0. 10； m SI ^ C 旳冗安求忏定 S a . 欣彐丑仪彐 p 2 Ui ； ^ 
/> RtP lv \/ T~J Rd * Uv ^ "/If - 3 ^ A\ itH - t^h iv 

** p J f^u 4 l—〆!《* ▲ * U • Jt^ i Jt^ c • ■ •• 礓 J 、 I , I ， fKa u • 

数学上可以证明， 

0 …: i C, 

^ v l 

^ p \ fi ^ ^ i^ c i I = f ) =f ^^/?(!•) 

* _ r\ 

t=u 

r 

i • * 

' ， n \ 

1 P Pl p 2 (Si ^： c 2 |S!+S 2 =r) = XI〆^) ”* 

l=C 2 

■•二 » 

取最大的整数 Cl 满足 ^ Zpax ^ r ， 再取最小的整数 q 满足 


II I 

y ^ jp (0 < y . 则在 H。 ： pi = p 2 成立且 S!+S 2 =t 的条件下事件 

l=c 2 

“ Si 众 或 Si 的条件概率不超过 a. 可见，在 Si+Si 的条件 



IF Si < ci 或时应拒绝 H。 ：办 =/> 2 .根据样本值又?，“ •，: 及 
: y? ，…, 式 和 (6.13) 知％ +及=，，已经发生，故5； -< Cl 或 s? > q 

, V 0 

, 5 1- 
rt-L A/r T T t=t n / AUt *W? Af / 山口 n \ ^ . / *\ ^ 

wfmfEJe rio：pi = p 2. 皿热巧 \ q 旳兀 安求 rt 定乙 ^ 


1 •_ ■■■▲• / * I ■置 / • v ^ 0 ^ H _ f V / •« _ v 纛 ▲- * ^ f\ v im* f _Xs^^ 

彡 c 2 v 的允安余忏是必么扒幻取:从(^,厂 o 郑 pz^)^a HTJE 


铯 M ) 


5 i 



h. 这时检验水平不超过 a. 


以上叙述了导出 Fisher 精确检验法的统计思想.下面介绍实 

* « I ^ 

琴工使中采用的用于计算 所有以 v> '的具体 方法. 先引进二个定 

i：. x^j ■给定的叫 ，价和 t (见 （6. 12))，称非负整数垣成的矩阵 

■ - . . - » 

a b 
\c 

B "Ht-t AAt 一 I z_ — _ I J ― 一 I i P4 Jbh.^ "Brt XHr i-t» 

疋丘取 tf、j u^ro—ni yc-ra — n 2 ju-rc — i. 亚於赘 及取吁 |±1 丹江 

上角元素 a 唯一确定.左上角是 a 的阵称为 a 阵，用 A a 表示，显 

HbH 

热，右 



IDII 


从 （6. 18) 知 


A ，| J (^1^>1) 


\c 


A 


a~\~l 


• /(2 + 1 b — 1 

l 1 夕 -Ul ' 

' U X C 4 / I X / 


I 

I 


p(a-hl) = p(a) 


be 


(a+1) (t/+l) 


( 6 . 20 ) 


(6. 20) 比 （6. 18) 的好处在于 :公式 好记. 


.. ^ A V 9 # - ^ ~ ■乂 A , JT W V V %>_ t • — ^ E 邀 • •、 , ^Sk —o •%. 

从户 U ) 的足乂(:见 C 6. lb )) 知，当 t 小俩足卜夕! J 小寺瓦 （6. 21 ) 


时，/>⑴ =0. 


n 0 ^ i^n 


( 6 . 21 ) 


这里 


h 0 =max(0,7i 2 一 t) ， n* =min(n 1 ,i) 


( 6 . 22 ) 


m m r 

• J 40 • 




先依次列出，然后计算 /» U 。）， 再利用 
(6. 20) 逐次计算 M / Zo + l ), … .当然 ，对于检验 Ho ： ^<^2只需 
列出 ， A < +1 ，…， A „* ，计算出相应的 p { s \) j p { s { + 1) , ••• , 
Pin ) ;对于检验 H 。' ：九>/> 2 ，只需列出 A „。 ， A n ()+1 ，…， As ? ，计算 

山 -ta Hf A At t/—\ l / — I -i \ . / 0 \ 

03 TH )^L WJ pvn 0 j ，•••，/?、$!/• 

例 6.3 某公安局有两个刑侦组，在过去一年内第一组接手 


r\ p- /ii* I A^. * 多 ■* /—t- / —^ 八八 ，“— A» A * a*-* LJU 八 — t»\ t 人 j >» / • - 

n 1 干人 W 茱，珀米 1 贝攸 i W 忏； 罘—组按于； ib 忏人茆莱，轱罘1 贝 
碱了 30 你_问.而+铂的估姑能士右千荖則？ 

w ^ I I • ，蟑礴 H I , "頦 UfS f»^v ■蟾 >^V « •- 

• # - • 、 

V Mrft r I _ M. * # * ’ > - ▲ » % ^ ^ W 龕 • 盧 — .A » * > 4 

解坟 WI 个组的侦破率分别为和/> 2 ,要释辦的假设是 

t k f 4女田 Y _ V 且一值随如 i 县 Y = 1志 G 笛 一 仝日 

▲ ▲ u • jr 丄 jrz • v Jka-^ac. ？ 丄 Fir — ■* u±. rm i/u ，‘久 丄 <vv ai、«^cl 

侦破成功， X =0 表示未能 侦破; 表示第二组侦破成功， Y =0 


^^^ / 4 irrfr 人一 d/ v — 1 、人 urv — i \ 、 =m/rr 龙 m i? 、 u 八 — 
>PC/J 、 y\^ Hts 1^ VtK* jPl 一 』 _ 丄 / ， 一 1 V ± _ 丄 / • / % II J 7N m 1 i^a^i 

精确检 验法. 现在《1=25，〜=35,5?=23,4=30，《= 53(参看 

* 1 

(6. 13)). 从 (6. 22) 知 ”。=0，/2* =25. 从 (6. 17) 知 

' 23 25 

pz ( 5 ?) = 2 min ( 〉: 〆 O ，〉 ] pd )). 

1 = 0 i=23 

从 （6. 15) 知 pm )^=0. 252,从 （6. 20) 知 


*(24) = *(23) 

± r A ' 


2 X 30 

A V ^ 

Z 4 X 6 


0. 105 


1 V 9 .Q 

p {25)= pm )^^ = 0.017 

ZJd 入， 

于是 

25 

2] p ( o = o . 374 ， 

,，=?匁 

W 

23 25 、 

Y 1 />m = i — V 4 - i ^(?^ 

/ j \ — x — / ▲ jb^ \ ， x I \ — v / 

i=t)' 1 = 23 

= 1 -0. 374 + 0. 252 = 0. 878. 

从而 

p z ( s ° l ) = 2 X 0. 374 = 0. 748>0. 05. 

于是在检验水平 a = 0.05 下不应拒绝 H 0 ： p x ^ p 2 . 换句话说，没有 
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理由认为两个组在破案能力上有差别. 


•7 拟合优度检验 


iifr 757 i « i / iM 曰 士 ISrEl 甘 y ^ xfe>tr Ah / Aal -hn ttT 

[3 U 叫口 y rj Pts ^ s 、 疋 IR/t ; E 、 Kf ^：7 J /» J 木 f V 用/^口口大生 V P 7 J > CM_LC 

态分布），而对其未知参数或数字特征（例如期望、方差）进行假设 

XA. t » 八 人 * , 、 •^ 4* 人 -V A /_L* JLt* Axtut T^rrt / V -A— t— -J ■•* -4rH -<J HA. TTtl "d 广 h / • »-»_L 、- T* TXXT 

恨诞.忑么沖退一/|'於 伴 旳慨 半 or 仲屑丁呆 w 失型呢丫泪时迚安 
问.乍々 铂增 一个焓汰的斗布函断县苴个給奋的函齡 FJx ) 呢？ 

■鑌 7 /IU 、 命一％ / ，n 4^1^ | 丨 I "V T />4^ ， 1 、 I ” V I I • * U ' , / U • 

t f _ _ ▲鲁 m m 1^ - ▲ . mmmm^^m, •— _ • * ■ ■ _ Jt 一 ^ b M * k M » 梟詹 • ft rntmmmmmmtk. ■ 

这是十分重要的冋题.有时根据对事物本质的分析，利用概 

由 A 66 4^ 口 7 rn ”々 A ^; rFn 佐 /口且女伯企桂 >ott □热 Li 一 +祕新 

干 VU MV /SH y /\ 9 ^4 K^\ ^ 4 H W * lULAt ^ T ^ lIK^ fR UU I > MC/7V / W 从 

J 

据中去发现规律,判断总体的分布是什么样子，这就是所谓的拟合 

i>zt B 右 、 

一 般而言，总县 先稂抿 样本倌（一批观_数据）用第二童中介 

r ^ w - - 'w w ~¥ ^ ^ m r ^-- ^ -w 9 w m r ^ T w 

绍的直方图法，推测出总体可能遵从的概率分布(或密度函数），然 

臼里剎田: *: 书■跖批的 t 法本拾給後 M 饮的从右 函齡县 本直的就县 

/I-I I 4 M / M r j— iy \ rj \ MV 1M /| 、 1-^ wy^s n - mv y^s • 1^ >^V ysi_ |-4 M V 

< • 

给出的函数.下面先介绍 / 检賒法，然后介绍柯氐检验法和萁他 


f Jk —* A ^ f , 

umm . 


\ V Z 4 iA. tlA. > 4 - 

； A 但祖広 


生讲“簡里假设的楡賒. 

^ V _ - I ， | V ▼ _ ■■_ _ Y ■• - 

I 

、分令 '^ ^ IkB# t I i t » _ - , # • 廬 • 歐 • # _ W V ^ •**• >nil 、 

议 A 的分布凼数 f U ) 是禾 知的. 绾足分布凼奴 hU ) C 即满 


Hfefr 亡成换 R 1; 州 17 

At ； ^1 ^ V*J^ %^)-1 JCC^C J=U aaha -l o 

: r-^oo 


I i Y r ^n 

9 上 illA 

r—► — oo 


Fo 


0)， 我们要研究的 


检验问题是 


Ho : FU)= FoU^^H, : F(x)#Fo(x) 


▲ * — t ML A 、.匱 ^ v t 、 w -龙 ■ ■ ^ ， 

X 极验沄口 J 叙还卯 卜：议 1 


• » • 


智， • • j 二，二 ，， # # I VA t . ^ i : 、 • 

， A „ 是米目 A 的砰不.在头 


轴上取 w 个点： G ， i 2 ，…，‘ （M <… <X ) ，于是把实轴分成 


①若在假设 H q 成立的条件下总体的分布函数是完全确定的，则称 H q 是简单 
假设;反之，称 H 。 是复杂假设. 
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w +1 段，第 1 段是（一 oo ，~]， 第2段是 （ G ， G ].，•• •，第 m + 1 段是 
(~, oo ) .用 v , 表示 X 2 ，-, X M 中落入第 I •段的个数 G = l ，2, …， 

m +1)，！ 是频率.螽示： Tfel 值落入第 z 段的 概率.如果 H () 

»■ •- 尸 - w r ， ▼ 晨 w ■w — — ▼ w w w —» w f ~— —• - — w - — 

71 

fit/vr .mil ^ 县抗 i ) i 苗_屮.本的、里泣 ： hL 

7 jt t a*-t ' ^ “m 〆*、• mv y _l-. j 

P \ ^ P (. x^^ti y ~ Fo (^ i ) 

pi = P{tj-i ). = F 0 (ti ) — F 0 (.ti -\) (2^z^ m) 

\ , 1 >^ = P.(X = 1 — Fnit „) 

y 99 ^ I a ^ »w » 'v «»»• r 

Ll^t jJ**t J^ra* - K_tU-T^ ■ 丨 》 上 L \/. —L. . ，一 art t , 二 % - — ^ t—* -i—# . • ▲ I Ttrf 

根烟怫半勺频半的天乐刘，卯朱 rt 。 成互冊丘 w 乂 H ； 牧 X ，那 

么^•与 a 差不多，就是说应该比较小，于是 



也应该比较小才合理.这是因为 f 起了平衡作用.对于很小的 A 

Pi 

， I 

i 

O ^ 

而言，即使很小， $ 与 />< 也可能相对误差 很大. 因此 

(^― a ) 2 /^ 是用来刻画^■与九接近程度的量 • 

我们就取V作为统计量.由于样本兄，…， X„ 可以看成随机 
变量，所以 

y = T ! (f • _) _! (7. l ) 

np { 

也是随机变量. 

经过数学方面的研究，可以证明（本书从略） ：在 H。 成立的条 
件下有 

lim P(V ^ x ) = g m ( y)dy - 

«-H^CXD ^ — OO 

这里^«(30是 m 个自由度的X 2 分布的密度函数.换句话说，在 H (> 

^ ^ a 

下，V 近似服从分布.给定(0，1)查 f 分布表，可找到 A 使 

1 a n 

w 1^:0 • 



gm ( y)dy = a 

«/ A * 

■ • 

于是 P ( V > X \ H 0 )= a , H 0 的否定域为 W 0 ^{ V > A }.. 即根据样本 

值 T ,」•• ‘T 1、+ 昝•屮 • V . 甚 V ^>5 哉拓祕 R … T ^( ^ = ^ •甚 VC 

•XX . 〜丄 7 7 ^ 71 ， I T~ «-M T 7 -T—I ^ ^ §\ f^yu 4 L- —-LJ ▲*1 »«太 V ^ 太（ ^\ 〜， , -T—I ， 

A 就接受 H 。. 1 " 

? 

丨 \ |v 一 y . t. -^I> C3 Mr A-# 上 L tK » U _LA. Tt A v . t. I=t T r — ¥•* -% r\ r\ r\ Aw* 

X 还力汰肌定者石 tfiU 恨叛汰，定 iV . rearson 丁 iyuu 千 

搵，屮 ，的： # 宏陡你 ffl 时加侃视逾 m 及分占^ .…呢？彳女并 

▼ n ¥ ， ， * _ ^ ^ r • ■ , J ^ 99 •■寸 ■通， K ， ' ~ '■ 一^ 1 , • ^ ^ MWX ，^ ， i 

Sfi 性规定.对于离散型分布 ，这些 数的选取有比较自然的方 

\ / 4 鼻建 *• 

味 （ fm ? sT 的你 h 对平连綠刑你右.右 a 逮仿知 4 估田亩古闳达 

im \ I kxi mv UA ^ -4 <5^ 'r* 7 m / 、， jFf. % rr |^. / m m. /V 1M 

» * 

rtf 哇泌士 n / i、i Vxt „ ^ uu 6^^ ^ 攸川 、 M 米 fir a 斗 t A ee 古 

h-j in /ix a 口 h^s f *x^ ^ 9 w, yv i^ujyi ^ 叩 ， j，wj 从 r ^ yy uu ;^i 'hj 

Xi 略大的数，将区间 [ a ，6] m + l 等分，可得分点 h ，…， ~. 

: J v ， - . 

读者可以通过下面的例子掌握 f 检验法. 

« 

例 7.1 某工厂近5年来发生了 63次事故，按星期几分类 

如下 


:星 

K '， 比 

期- 


二，• 

三 

四 

五 

，六 


mr 

XX 

9 

1 A 

IV 

< 

1 1 

8 

13 

1 o 

丄厶 

1 


' 、 V 

rsi .童协的世生且本 b 臣地 n 右立19 

1^4 I HA. 二 L- AC. I-J 7yj y Li n : 

用 x 表东这样的随机变 i : 若事故发生在星期 ^ 则 x = z,s 

v AftTrr6b/4r a i o … c / 曰甘口 口木汰 r^r^/JrD 、 

八卩 :； hj 日匕 m 疋丄，心， --- 生 m yv ) n、w /• 

:H\ / >i th? 4>Al tiA. AA /m ^rL B r t r% / ~\r - \ 1 / ， i - n n \ 

: PC 1 U 安 IS 题们取议定 n 0: r、A = u = ^- u = i ，6，* H，oh 

6 

6 / v 2 / 

估田卜汰铱朴昼 v = . 汶苗， v . 县毋出女 m 

u^,/ 1^ _L^V^J--5^U ^ I ^-t-\ T 6 / / 6 >s& y^*W | . (_l- r JC^ 

甘 H ; 66 亩 dbfr 分米 fir ， 杜杳 w = t 4： U "IT T / /M BB Li C 水白 cb 由 66 

7 T \ ^ wy 于队1八：5?人 丄 AS 、^/ • ' U * U 0 I y ALL |^ A / JI ^/7 V ^ | 口 m / 叉 WV 

/分布.查 X 2 分布表知 P ( V >11. 07> = 0. 05现在 Vl =9*， V 2 = 

a. V •惠 砉 i •盧龜 ■ ■ w- •mm —> • ^ __ • #■ >■•■■ • % w> ■ h ▲ M > ■ • »^ fc—• 

1 ◦广 •，〜=；^，评昇得 v = l . 67<11.07, 故假坟 H 。 小能拒绝，即 

7 f：mn 士诠出蚩册与昆地 n 右主 

■ rau w / w /^ — l - -J /yj / u ni /、 • 

通常在拟合问题中，要考虑的分布常含有未知参数.也就是 
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说，待检验的假设是 

H 0 : F(x) G {F 0 (jo ； 6i ♦••• 9 d k ) : (^i ，氏 ）} 

这里^是已知的集合.例如要检验文是否服从正态分布，也即要 

• - ^ ' 

检验 H 0: F ( x)e 任意 ， j > o 卜其中步是标准正态分 

' cy / 

布函数. 

9 

v 、 • M ― 士 _ /M-t 、 # _ •、 , LI 」- _ 冒 .• t 炎.嚴 t ■■ 會 ft ? 人 /*Tf -1. m. m LA. A v I ^ 

这定夏罙假 议的闪题. 目然想到也用 M 囬彡「绍的 X 恆湿抜 • 
里炸音的县.女 "FT Y 肋倌兹 人笛7段的概衆力.子法吉法笪 

■—l- p-f ^ yvw 7 i-l -. 表办 u v ▲皿 一 * ijo* i r ^ ，| v - M v I7W I I w n- / 厂 

出.此时可用 T 面的方法 

off rfrt — » i3^ 、 I^ ( — rv"^ 、 ^v» —I— 1 RT I'rtl ^ — r^o — t. ~1 . 

，l h 卩 ! j po4 ■ |十 M'J V vv 9 / J4 gtif 1 A I 1^ l M 4 v - 赘 」赘 

( M ， G ]， …， ( X ，°°)， 则有 

h 

\ 

^ f d … n \ : _ X7 /‘ /i … n \ 
y\ vt7i ，’ ，• ， Uk) 一 vti }u\ ，，- • ^Uk v 

Pi (6 i >••• ， Q k 、= F 0 UnQi ，…， 6 k 、 一 F 0 (^-i ；6\ ，… ，氏） 

z_ = 2 ，… ，m 


t ) 一 （ f )' ，… ./9 a ) = 1 — Fn (L :从 • ••• nOh ) 

A 99^ —— v 、_ " 摹 ，— IV ， 


tb yfw V, - • • • . V 々 }4L A 1 m —I— 1 RT Tol ifeift - - V = 1 . • • • . m —(— 1 * 

m-i I 丁 r i~^ iii ， y tTT / \ * I 丄 I ic-l. i-^j ^>s —|— 7 y 7 y 9rtf 1 j- y 

n 

多项分布可求得 ❹ i ， 6 k 的最大似然估计仏。，…，氏 o ,即由 


Vi 


mj-l 

表 ra . 

I= =i w" 

求出久。，…，久 0 ，记 


3 pi (6 i ，… ， d k ) 


泰 


o k 




0, 




1，•• •，是 


r <_ / n n \ /• 1 I 

Pi = Pi 、 0lQ ， … = 丄 ，•• •，/ W 丁 


数学上可以证明 


"暴 I i 

卜2 


(vi _ npi ) 
▲ 

-VI 

, tr J ^ i 


近似地服从 m —々个自由度的/分布. 这里々 是未知参数的个数. 

、 I % - _- ■ ▲ ■ jf A 砉 參 -- t b k Id — . 秦 身 _ V - 

但买杯码用时，当 n ( •) 是连续凼数时，上还求的0,…，〜衩淋 

烦，而变通地采用下述做 法:假 设总体的分布函数是 Fa (X M ，…， 
氏），样本是不，… ，兄 ，首先用最大似然估计法找出未知参数 




1 crr\ 
1 UU 





0 i ，…，氏的估计值 义 ，…，么，于是得分布函数 F 0 ( jo ； di ，…，良）.形 
式上和前面 : 一样，计算九： 

Pi =F 0 ( 旬；么， ••• ，么 ) 

pi ~ F 0 (ti idi ,••• fd k ) — F 0 ( ti-i ； d \ ，…，么）， z . = 2，3 ， … 


m 


Pm+1 =1 — F 0 (t m ； 6i ,••• ,6k) 


仍用统计量 


… i ■ 

fft~r . 


v= 2 


ivi — npj) 
nth 


査分布表可找到 A 满足 


gn ^ k ( y)dy = a 
J A 

肋本虫诚 W , = K 刖劣时拓餡一坐时按恶 

|—I / >4 — ，， u l ， 0\ ) 7 - 1 F ， 八 r* J •! L- -n_i u 7 - 1 ， J JL>S 

Ho . 这样的检验的第一类错误概率 P {\ C > A |/ f 。} 也近似等于 
例 7. 2 历史上有人对一块放射性物质进行观测，记录每 
20秒内放射的 a 粒子数，共作了 500次观测.得表 7.1: 


表 7.1 


放射出的粒子数 

观测到的次数 

0 

14 

1 

35 

9 

tmJ 

70 

V V 

3 

105 

4 

102 

5 

81 

6 

52 

7 

23 

8 

8 

9 

5 

/K =-F 1 n 

» ^ -4 鳍 ▲ w 

F ； 

合 计 

500 


-• 严 -■ 

• 101 • 






由文献知放射性物质一定时间间隔放射的粒子数一般遵从 

■ 私 • M \ # - ^1. m % » %. • • to » ft _■■• 丨 rn . 身 ■ ft i - fc V 鲁 I V 參 - P - ft » • 丨 —k — 彀 丨身， • m 

Poisson 分布.问.•从这批数据出友能否认为放射的粒于数服从 
Poisson 分布？ 

设该物质在20秒的间隔内放射出的 a 粒子数为 X ， X 的分布 

• ^ 

日.人一 D/ V — / „ — A 1 O \ 2 二 1 

7E ； y\JL) — r \J\ — JL J\JL — u ， 丄，厶 ，” •八 J.C* 

A >( x ， A ) = ^-： e~ A 0 = 0，1，2,…） 

T ! 

要检验的假设是 

u 4^( ^ l ^ n \ 

i yo v-c y a / : a ^ v / / 


舌出泊 I 田勒 riBHT : H > 山〕 66 基 + / 〖"彼 / fdbi 、4*4 t f = Q Q 7 壬〖 I 田 / 入才 

口 y u ， g / u vn ^4 jAi lm /v w j -qxyv im ^ u ， • ，| ,j / m za 

/ >i = T7e A (f = 0 ， l ， 2 ， … ， 9) 

i ! 


及 


/ ? io = 2 e ~" 

i ?= 10 




2 a 



可算出/>。，…，/>1。，再计算统计量 


V= 厶 

A 


( v ? _ nth 

__ » A 妒 

npi 



这里 v , 是《个观测值中 a 粒子数恰为/个的个数 (0< z <9) ,^。是 


I t _ * I ■— — ▲ •奢 鐘 k # %> t «# • # • 身 ^ ^ ■ ▲ . 2 # t # i > - ^ # - 

权于奴小小卞10的观测仄奴.口 J 昇得 V = 7. Z 75. 査 X 分帀表（目 

由度是 10 —1 = 9) 得到临界值； 1 = 16. 9 (a = 0. 05). 现在 V =7. 275 
<16. 9,故不能拒绝 H 。. 即可以认为《粒子数服从 Poisson 分布. 

例 7.3 某车间生产滚珠，随机抽取了 50个产品，测得它们 
的直径为(单位 : mm ) : 


丄 D. U 

ID. » 

ID. Z 

丄 \ 丄 

15. 6 

15. 3 

15. 1 

15.3 

14. 5 

14. 2 

14. 9 

14. 9 

1 ^ i 

1 A ' Q 

1 A 9 

1 A R 


丄 1 ：番 G -L T ： # \J 


丄 d. y 

丄 4. / 

14. 6 

ID. D 

15.0 

15. 6 

15. 7 

15.8 

15.2 

15.0 

15. 3 

15.6 

1 c ； Q 

1 R 9 

IRQ 

1 c; 9 


-L V/ # KJ ^ KJ % La X # U X 


15.0 14. 9 14. 8 14. 5 15. 1 15. 5 15. 5 15. 1 



15. 1 15.0 15.3 14. 7 14.5 15. 5 15.0 14.7 

-« A A 纏 _ J 

J .4. b 丄 4. Z 一 

我们 问：滚 珠直径是否服从正态分布？ 

，设滚珠直径为X，其分布是 FU).，, 待检验的假设是 H。 ： 

… \ ^( X ~ 

r kx ) t ： - - j ifi (JI 

仍用/检验法.首先从数据出发找出的最大似然估 

计县 

，V 

/i = 15. 1, ( j 2 = (0. 432 5) 2 

取 m = 6, 这50个数据最小的是 14. 2‘，最大的是 15. 9.取 a = 
14. 05,6=16. 15,将 [a,6]7 等分,得分点 ^ =14. 35“ 2 = 14. 65, 
在 3 =14. 95^4-15.25^5 = 15. 55, =15. 85,实数轴被这些 ^ 分成 

了 7 段，利用及正态分布表可以辑 到 1 Pi 如下： 


Pi = 

= 0 . 041 4 , 

p 2 : 

丄 0 . 107 7 , 

p 3 = 

二 0 . 215 4 

^h% — 

厂 4 _ 

^ C \ 971 n 

— \J ^ “，丄 \J 9 

厂 5 

— n 91 C ； A 

lj a.\j f 

4-\ ^ — 
厂 6 一 

= 0 . 1077 


_ r\ r\ a a 

p 7 —— U 4 : 丄 4 : 


^rtOT - ▲ _ 14' 、 I _ /* i * > |*r， ^ y 1 ^4^ —• 一 * j ， / - I j ^ i\ \ J*r-t 一 

现仕术 rr 畀现 rr 星 v ，万使丁恨宜，列衣 l 衣 /• ^)nw r 


表 7.2 







10 


• 864 9 



7 ano n 



0. 004 9 


0. 417 8 0. 027 5 0. 055 1 ,0. 443 0 0. 712 4 0. 070 2 0. 002 4 


153 





























V = y ； ( n - pi - :以 = i . 728 4 
~ n Pi . 

取 a = 0, 05,查 X 2 分布表（自由度6~^2 = 4) 得 A = 9. 49. 现在 V = 
1. 728 4<9. 49,故不能拒绝 H 。. 

上面介绍的检验法称为分布函数的 f 检验法，也称为拟合优 

度/检 验法，它的好处在于不管总体的分布是 ft * 么都可以用，因 
而应用较广. 

(二）列联表的独立性检验 

作为/检验法的一种应用，现在介绍列联表的独立性检验. 
设随机变量 X 的可能值是 l ，2,_”， s ; Y 的可能值是1，2,…，/ 
(5>2,^2).现在对向量 ( X , Y ) 进行了 次独立观测，发现“ X 取 
i f Y 取） ”的次数是〜（彳=1，2,… ， s ，,= l ，2, …“)，要据此检验下 
列 假设： 

//。：乂与 Y 相互独立 

在这种问题中常将数据排列成下表（表 7. 3)，称为 sXf 联立 
表或列联表. 


表 7.3 




S 然 

记 


5 


n . 




y.rijj (> = !,••• yt ) 



pij = P(X = i 9 Y = j ) 9 pi = P(X = i ), qj = P ( Y = j ) 

待检验的假设就是 

T T . . / Irrr • • 、 / n r\\ 

n 0 : Pij = PiQj V 一 VJ t，jj U- 6) 

首先在 H 。 成立的条件下找 A ,: 的最大似然估计. 

5 t 

注意似然函数为1>= JJ 〜，于是 

1 = 1 7 = 1 
5 t 

(Tiij In pi H -- Tiij In Qj ) 

2=1 j = 1 

解方程组 


^ln L 

d Pi 



d\n L 

d Qj 






p i 9 q t = l - 29； 


■ ■ * \JkJu ga r #.w • t I . 、釐 v» 

个难 刈退最 X 似然怊 rr 刀 




(i = l ， …， 5 ，j = l ， …“) 


研究统计量 




滅 A 

riij — npiQj) 


A A 


np iQ f 

a — ^ 


(7.3) 


根据（一）中介绍的一般理论，在 H 。 下， V 的极限分布是 Z 个自由 

^ - . 

度的％ 2 分布，其中/ =组数 一1 — 未知参数个数 = 灯一1 — (5+^—2) 

■ - r 

= 1 V/—1 、平县 v /hi u Y 2 rrc— 1 ^ r/— 1 給空 

v ^ A /、， 丄 ， • 4 |*SA /J^ w/v \ \ ^ 丄丄 ， / /y ，尸 • 


2 


aG (0， l )， 杳 Z 分布表，可找到临界倌 A 储 P ( V > X )^= a . 取否宙 

_ - ■—- - III !■ _ - ▼ r - "W -r r , W ~ 'm — w ~ r r f 


域 W 。= { V > A } 就可以对假设进行检验了. 


_ 


7 RR 



引理 7.1 


证明: 


V 有下列简单的计算 公式: 



V = 


2^j 2^j ( Wi > 




n “ 

n 


n.i 

j 

n 

9 ^ 


(7,4) 





l i 

钟 



— w ,* n.j j j rii . n.j 




)j n “ n 'j 







证毕 • 

^=t=? h 计田垣县广 .nU ? 聪古志 nrn 故卖） iFkn 计 

v ^ w 『■喊 / 7 • I = ' ' T/V m u ■- \ F 一^ • I M 今、 / • >^U ^ J 

» 、 * « 



n ( n u n 2 2 — ni 2 n 2 \ ) 2 

«i. «2. n.in.2 

_ ~w _ 


(1 Q 




自由度 = (5—1) (t— 1) = 1 

例 7.4 为了探讨吸烟与患慢性支气管炎有无关系査了 

rfc rk /-\ f t-»* 、 it~r m — r - - I- * ✓ I-* a v 

wy 人. m 饥見 r 衣 q 衣 ^: 

%r 

表 7. 4 


身 hi*» 

人 数 

- ^ » ▲ • • # M . M . •義 

思慢性叉气営炎 

未患慢性支气営炎 

M w v k 

甘 tr 

吸烟 

43 ' 

162 

205 

~r" tITL .UD 

*1 o i 

丄 0 

1 O 1 

161 

n a 

合计 

.56 

… 283 

… 339 


我们可以设想有两个随机变量 X , Y . 任何一个人，若他吸烟， 

t • 

Ml. 一 > ■重 -fc I • • 蠡 — t • A _ — 詹詹 _ • • at to _ m> . §h A . • • ML 

令 A = l ， 若他小吸烟，则令 X = 2, 若他患慢性叉气営炎，令 Y = l , 

老丰宙棍处古与禅冰 m\^s v=9 口 

^|_1 /黑、必、|又 U 1- Vi e -W » y ^ m 4 < i K_j 


Pi ：^ P ( X = i 9 Y ^ j ) 


156 












pi = P(X~i) 9 qj^P(Y=j) (i，j = l ， 2) 


#、—• * - t, A . A ^ w- 

获 II j 米恆狴 Ho: 


Pa =Piqj (一切 i ， j) 


2 


根据上面介绍的 x 检验法，首先计算统计量V，利用公式 a 5) 知 

v=„q v (43 X 121 - 13 X , 162) . 2 =7 

… 56 X 283 X 205 X 134 ，… 

对 a = 0. 01 ，查/ 分布表（自由度为 1) 知临界值 A = 6. 63. 现在 
V = 7 . 48>6. 63,故应拒绝 H。 ，也即患慢性支气管炎与吸烟有关. 

(三）柯尔莫戈罗夫 （Kolmogorov A N .) 检验法 

前面说过，不管总体的分布是什么类型，; C 2 检验法都可以用. 
不过，对于连续型的随机变量，本段介绍的柯氏检验法更好些. 

设X的分布函数 F(x) 是未知的，兄，…， Xl 是样本. F 0 (x) 

n /•入 -fc#- X / V -A— -rix Aw t 4 ^ T*rr ■ i _ -rr.t 丄入 ■=» 人办一 » mr 

定 m 疋的呆/「方仲幽戮 . 双 iu 术饥九 r 列恨艇 irj 趙1: 

H 0 t F ( x )=' F 0 ( x )^ H a : F(x)#F 0 (x) 

4 . « 

ik. M - m — 編 few* «b . _ ▲ % m *- - - • 金 ■ - _— 

苜先从样本出发求出经验分布函数 F „( x ) 如下： 


F n {x) 


r 0, x<X 


( l ) 


k 




V 


1 ， ot ^ X („； 


这里 X ⑴ <x (2) < … <x (n) 是样本 兄， … ，又 从小到大的重排 . 
计算分歧度 ^ 


sup | F n (x) — F 0 (jc) 

— oo<x<oo 


im 进女毛 nfric&i ： n7te 县 mil n 且 icfe 士 rtTte 县 u 笛一杳卓 xh/i i 

wrr 个旧从 wul 又里， 以 n /t, na ul m* / 7 v pr ―^平杜丄 

(Glivenko - Cantelli 定理）知，如果 H。 成立，则 P(limD„ =0) = 1. 
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换句话说，如果 Ho 成立，而《又比较大 ，则认 的值不应该太大. 
如果 D n 的值太大，贝！ j 应该否定 H 0 . 因而否定域应取 


W 0 = {D n >X} 


(7.6) 


给定 a6(0，l) 后，应如何取 A 使样本落人 W。 的概率为 a ? 这就涉 



及到如何求出的分布.下列引理告诉我们 ，认 的计算公式相 
当简单，而且当 FoCr ) 是连续函数时认的分布与 F 。 Or ) 无关. 

引理 7.2 




max max 

1 n 



— F 0 ( x ⑴） ， F 0 ( x ⑴ 



(7.7) 


I f ■— ，• 一 i ■ f y 、 v / ^ ^ . j—t _ 廬 - -/■ A v 、 上 ,- L\A f - r—t»t 

fmja 卯罘 ux ) 是迕瑛凼奴，: ^ ，…，是米目 ， Q c ： c ) 的怦平，则 
n 的斗龙互子戈 

n ff v y^i * t 9 v A u v ^ 

(^ 

d d d 

4tP HQ . tt? ^ . = : r^~s -v*. . -=. rv^> 17 ( 、 =zz J7 ( —— oo 、 = 

VAX^ ： y4 l ^'4 AC, 丄 （ 0) ，义 （ n 十 1) - » -«■ 0 V - / A n v -/ 

* 

0 .则 

M 飞 ■ ♦■W% f 、 _ ___ f 、 

±^ n 一 ilia 入 2>up i* „ \ jl ; — jl' o y 

0 <^<w x 6 [x ⑷ tx ()fe+1) ) 


m q v nr\ o v 

XXACL^V. XXXCL^W 


(音 


X 


Kk ) 


， F 0 


\ k ) 



分主口 FT /7 7、士 士 zfeh T ? /„、 上士姑 mil T 7 / _ \ 17 / „ \ … I ? / « 、 

v / •/ j 石 r o vxv 迁狄， y<_j jl 0 v 义 i y ， jt o v 上 2 / ，…以 0 \ jL n / 

相互独立，都服从 [0,1] 上的均勻分布，而 F D (x ⑴ ）< Fo ( x ⑵） 

/ 、问 -LA* /—t / V -/e-* AA v£^ > I. B. / •、- 1 上 “ iTi4 人 / V -/e-* _A^ -LAt 

\ r 0 、: c u) >> 定巧 > J 7 T 卬 WiH 人吁现 TT 里，匕 1 IJ 的狀百 TT 卬兀王恨叼 

1 

匀分布确宙，与 R (: r ) 无羊，从而 LL 的分布与 P \( x ) 无婪. 

"W ， ▼ I _ - ，，^ \J ' _ , -*^ ^ , ,， ， ■ 丨 "▼ /• r ▼ ▼ ， ▼ _ ■ r ▼ \J r ^ _ 


址平 • 


D 的斗右右官恭的类;女才_当 w 不士士时 .D 的斗仿齡卖 R 

n h v ■ r^ 1 j ih v 7 — i ^ ^ 1 \ ■ ■•鑌 7 n ㈣ v xv * 

造好，见本书附表 7; 当; 2 很大时，需要利用 D „ 的渐近分布.柯氏 

A 1 QQQ 体征 BB 了 1 C 石|| 范勿 [ 66士 I ； KH 奋畑 ▲ 

丄 —I- kll^ryj J I ^ VI VIV^SVJ llKr^AC.^n ; 


定理 7.1 


设 X 的分布函数是连续函数 FJx ) .则 


lim P (^/ nD n ^ x ) = Q ( jt )( 一 切: r ) 

n—^oo 1 

、 tV m 

込生 


Q ( x ) 




2(— ”〜一 


lk l 


>0 


k = —oo 


(7.8) 


10, x ^0 

泳木奋 Tffl 66^ C 卩日 to 伞匕 * H 山了 里班 66 故因々去类 TiT 矣毛寸 

I AC. W V UL 74 'I 口 =1 9 ACti LU J W V i li |-li| > 1^ ^=1 ^ ^ A 


献 [2]. 



从这个定理知道，只要片。 成立， n 又比较大，则士 IV 的分布 
近似地就是 <3 U ). QOO 的数值已造好了表，给定 (0,1) , 可查 
表找到 A 使 -■ 


P(D„ > X)^=P(y/nD n ^>y/nX ) 

_ 1 八， /~ > \ 

% 丄 ― WK^/nAJ =a 

(在附表7中对 a = 0. 05,0. Or 给出了 A 尚值) . 否定域是 

W 0 = { D „> A } 

上述方法就是著名的柯氏检‘法. 


例 7. 5 

356.4 
305. 1 
394. 8 

4 

377. 1 


A «« 八 

4丄 


批小动物体重为 ( g ) 


362. 5 
385. 1 

370. 7 

* 

* 

365:9 


A J 0 ^ -4 

My •丄 


394. 7 

356.0 

387. 6 

383.2 

346. 6 

314.2 

370.8 

434. 2 

• 

365.2 

j 

384.4 

297.4 

404/3 

* j j 

M 4. b 




试用柯氏检验法检验这批资料是否符合 JV (370. 6，（29. i) 2 )(cv 
0.05). ’ 


J 7 n ( M (^70 a .( 9 Q 1 的从东 菡粉 刺田 / A ^ tV 7 7、 

▲ U \ ， /V 學 ^ # v 7 X ^ ^ • 丄， /HV /V 中 # ^1 w 4 / IJ 一 ^、 \ • 學 / 

可以算出 D „ = 0. 104,对 a = 0. 05, 72 = 23,可找到临界值 ； l = 

n 9.7^. tbi n =rv i wn 91^ of VA U 士沐 : Hf 盗 *? L 雜各 tv 

v • w » V 7 OTJ ■ M ~^ r n V •丄 vxi U * V /V JMJ f \^\ I '4 I—I 乂 , 

(270-6,(29. I ) 2 ). 


要注意的是，若 F a Cr ) 的表达式中含有未知参数，则柯氏检验 
法不能直接用.实际工作者往往从样本出发找出未知参数的最大似 
然估计值，代人 F 。( x ) 的表达式，从而得到确定的分布函数,再计算 
分歧度认，仍采用上述的柯氏检验法进行检验.这是一神近似处理 


法.此时，的极限分布是否仍是上述的 QCr ) 就不得而知了. 

关于分布拟合的检验，还有许多别的检验法^比较著名的有 
Cramer - Von Mises 检验法 （ I 936 ). 它要检验的假设是 H 。 ： F ( x ) 

= F 0 ( x ). 取统计量 

\ ' - » 

W 2 =n ^ lF n U )- F 0 Xjc ) JdF 0 U ) 




00 


159 



这里疋 Cx ) 是足，…，的经验分布函数，积分是 Stieltjes 积分，乃 
是一种加权平均.显然，如果战.成立 Vn 又比较大，则 W 2 应该 很小; 
反之若 W 2 相当大，则应否定战.故否定域应 取为: \^ = {\^>又}. 
经计算知道， W 2 有下列简单 公式： 



11 、rV 人 /V — 1 ^ 1 1 1 4 *rt ffl ✓ \ v/-* 人 +- r r >- 4 ^ -X-. rtil ttt 2 AA /V -A- t— 

w m : 禾 r 0 n 0 肌兑 ，则 w tnjTT 邗刁 

i w * ^ 4 

F ,( t )^ T .^ 坐 77 相士时.也可摊 W 2 的折似公布.闽 ffif 也可摊 

一 u M , — I ■ ， t i-^v / \ P 钃 7 、■■ ■參 ^ -4^4 •■画 T r iz^s /V » 7 w -f ,, W » -# 

出临界值 A , ' 

t；isr fp 給路吐米 /l、f 讲/⑴疏庙八妨 一 nc q …; 州 … 6ft 油、择*於 

—J \KH J II J /W 15^ ^ I I v^iixix ixw v wV「；PTTfH 

验法 • 


* 

J 几 V V 曰 tfr 八 -fr^ r 7 t / \ AA -I 4 A -Jr- ', 

K Ai ， … ， a' 定不日 7T 仲田双力 r 1 KX) trvfF^P" ^ ^ 1 




曰 

疋 


夹白分布函数为 R (* r ) 的榉太，日两个榉本相百釉 u . 设 R ,R 

^ P " W V - p - _ P ^tr ^ b 、一 - , w—r ▼ ■ t p , III II■■ i ■ f f _ W-^9 ■ • ■ 攀 — 9 ■ ■ — - ■» ，太， ^ 


都是未知的连续函数.研究检验问 题：、 

、 ^ ' ■ 、 ■ 乂 

-» ■» u i -■■ 1 V ^ / i z / -a A a ; j. I y ― \-J. ^ V / 


设^ Cr ) 是不 ，…， &的经验分布函数，(尤）是兄 ，…， \的 

上 # > % i. 厶 、 u 

Z-X nA. ZV -fc 2 略 人 

* ** 

- =sud I F « (: r )_ G ” （: r ) 

-l I r *\ » "*2 見 I ，，1 ^ r *A 

x L 

可以证 明：在 H 。 成立的条件下， 



1 也 


其中0(工)的定义见(7.8) 


•l 


Jl t 11 * 

t - ^ 一 V i ■ _ ■ 、 I • 

箔疋 at ( U ，_ U ，取古疋域 


w 0 = u 


其中 A 可査表得到. 

r 

/ rm \ 

I » I 儿邮 1 工但扭 


在实际工作中常常需要检验一个随机变量是否腋从正态分 


2 


布，这叫做正态性检验.上面介绍的; C 检验法、柯氏检验法等当然 


1 t* r\ 

10 U 



哿以使用，但是上述方法由于是通用的，故有针对性不强的缺点. 


对一些特定的分布往往可以找到针对这类特定分布功效较高的 
检验.正态性检验的方法有裉多种，经过国际标准化组织 (ISO) 统 
计标准分委员会的研究，最后认定 Wilk - Shapiro 的 W 检验和 

書 

T\f A _ 丄？ _ AAt -IA.71A . 曰里 JrT AA ^TT Afr 一 卷 口 AA -MT ^ m .L 

U /\gosunutrj u m 题疋取 xrtrj， 匕 乐 一 天爾厌 trjm 平取 /J、. 

— t 

该委员会向世界各国推荐使用这两个正态性检验方法.我国已把 

v V- '-'TT ^ 人 > - 、y 11 f ■ J> j ^ m L- - ^ P (~f l~t tv i 八广 \ j— ■ 了 y _ A "■ ： '■i ii g 111 ^ A I. A 

珲网 t 万法列 入困豕称准，辆亏定 4»»—»5. r 囬彡 r 绡这网 t 恆 

> , 

龄法劣淫太暑时田 W 給胳.当迷太畺时田 D 給龄 

• _| ■ | ， | - ，分 v v ^ j / I-# T 7 |-^ y 1 I I ， I ， v v ^ \JLU^r^u • 

(1) W 检验 （w<50) 

I 

7rf 工换故向 Sff 

/'■J 4 ^2i 


H 0 ：X 服从正态分布 : X 不服从正态分布 


Xfh 

取沉 TT 里 




r^i 

L 




(«+ l - 走） 


— X ( k )) 


(7.9) 


2( Xa >- X ) 2 


H=h 山 TT / ', ^ ', 1=1 444 -A- TT AA»、JU rif > t 曰 - ( 、 

>RcT a (1) ^ A ( 2) ^---^ A («)^ i ^^ Ai ，…， An 的队斤现 IT 里， iA / 

县一细恃宙的倌 ，耵 从恃制的丟中杳得， 

x ，, ^ * — _ < ，驚 -r ^ | ■ >— ， ， ，， ^ 驅 ■ 篡冪 _ ■ 、 ▼ 


W 检验的否定域是 


W, = {W< X) 

\J \ / 


C7. 10) 


其中 A 满足 P(W<A|ff。) 




当样本量《<50时，国标附有相应的 {〜} 的值以及 a = 0. 01, 


0.05,0. 10时 A 的值. 

这一检验法的理由大致 如下： 

设不，…， 尤独立同 分布，均服从 JV(p，cT 2 )， 则 




a 


独立同分布，均服从 N (0,1). 令 — 

U U 

£：足 0 ，叫=£：1，注意叫 ，…， m „ 是确定的数，与"， cr 无关. 显然 




注意 w 较大时，，因而很小 • 这表 

» 

明 W 个点 ( X ( o ，777,)(;=1，2，一，；1)近似在一条真线±. 

'怎样判别/2个点是否近似在一直线上呢？可用下列统 计量： 


R 2 = 


2( X (l ) 

教 邊 

I = i 


— X) (nii — m) 



n 

Xy^Cm.-m ) 2 




在 h q 下，即诸足服从 iy ( /^ 2) w 尺 2 接近 i ( 岚第四章>•可 

， • ^ ' f ， 


m ^ /k m 1 、 orf mil rf^ 士口 nr 

<7Ui 丄 \ \A VA J X y H!J yy/HtliC ^ -*0 • 

由于 mo , l ) 是对称分布，所以 （ l ，…， y „) 与（一 I ，…， 

*■ W ▼ - -w p ▼ "w _ r r w — - 義 - ■■- w r ■ 

-1) 有相词的联合.分布，从而 h 与 一 Y „ +1 -* 同分布，故 m k = 

I 


"^7i+i -务 V 尺 — 丄 ，” • ^nj — 丁疋 


n 


R 2 




(0 m i 


令 


n 


n 


2( u ) 2 2 


//<， 


n 


i—^_i 

> j ^n-k-\-l (^(«+l-)fe) — 叉⑷） 


n 


n 


2^(0 - X ) 2 ^^ 


_ ^^rt\-\—k 

ak ~( t^y 

即得\^=把. 卜 1 

rn i=pt *>rr 1=1^ tt, _ r tt, / 、、 -tr ，并 -rto aa 

" J %， 不 ZtTtf 疋撕 vy 0 — \ vr 、 a / 疋匀沮牲 ff 、 J . 

当 p >50 时，采用下列 Dagostino 检验 （ D 检验)更好些. 

✓ v •— .A. — ^ A 〆 A v 

CZ ； iJ 极遐 U > bU ) 

对于检验 问题： ^ 

H 0 ： X 服从正态分布- : X 不服从正态分布 


LD6 ， 



取统计量 


D =^=^ - — —— 

I ~~ Z 

(^ yj ^( x k -xy 

V k = l 

y _ y ^( D - 0 . 282 094 79) 
v 0.029 985 98 

^ w ^— » ^ ^ — - ^ - . • ^ %k —. 最 — , ^ i a ^ ‘ 氣 • jm m. ^mmmmMk •- ^ 

在卜， Y 有确足的极限分布，记分布密度为 gU )， 取否足域 

W, = /V<^3. -5 & V^>3. \ . 甘由 2 .」 .进 S ( 

T r u i 丄 <?m ▲ • 乂 l ) y I /a 丄 ”、 z ir^ a*— 

^oo roo 

g ( u)du = — j g ( u ) du=l — — 

A ty %i AI 

£a 1 

国标附有 a ^ O . Olj . OSJ . K^fAwAz 的值 • 

* 

■ 

§8 几种常用的非参数检验 


在假设检验中，除了已知总体分布类型，对若干个未知参数作 
统计检验的参数统计检验外，还有一类所谓非参数检验.非参数 
检验往往不假定总体的分布类型，直接对总体的分布的某种假设 
(例如对称性、分位数大小等等假设)作统计检验.当然，上一节介 


绍的拟合优度检验也是非参数检验.除了拟合优度检验外，还有 

f 

々土夕杏 m & ftdb 矣 * nrr 6 hdt q -?4* 

叮夕巾厂 TJ 口:^卜罗又人似讽.取巾夕 LiRJ - l 卜罗从 m 迦机 m 里 /R d 大： 

數统计量、秩统计量、符号秩统计量.分别论述如下. 

/ \ 2 丄 Mr 2 丄皿 

V — 1 H WLm^l ML 

定义 8. 1设 X 是随机变量，对给定的实数氏，记 


其中 

4 V 



( pit ) 


1， 

0, 


当 t >0 
当^<0 


则称0为 X 按仏分段的计数统计量. 


( 8 . 1 ) 


. >±? m O 1 V _ V 士口 "TT ^rfr 士 V 1-hl 4^ ~&T .T^. 采 fr 

/ t 译 O . x 叹々" .… ，八” TH 上 L 似兄 ，节迁殊 ： /J 幽双 

( 工），又 F { ( 6 q )=po ，0</?。<1 ，i = 1 ，…， 72( 即 R (工），…， F „ ( X ) 



有共同的 A ) 分位数艮）.&，•••，&分别是1，…，的按^分段 

的计数统计量.则&，…， &相 互独立同分布，共同分布是参数为 
l ~ Po 的伯努利分布. 

证明： 显然. 

fr t ^ * ■ ■， n . 纛 i ^ # V ^ #. # _ # \ 、 ft t -1 产罾， ✓ V — 

从疋埋丄 1 知，仕一侬颗 中” •“， ip n 的犹 IT 重 ] CA ，…，0„)对 

一 切九分位数为氏的连续分布有固定不变时分布.因而可用这 
样的统计量去检验总体分布的分位数的假设. 

例 8. 1符号检验 、 

设不，…，是来自连续分布总体的简单随机样本.对于检 

1 

71 人 1 >— t 

姐 I 卩通： 

H 0 ： F (0)= y <- H 1; F (0)^-|- 

n 

可采用检验统计量 B = y 7 0( X ,) (0 的定义见(8.1))，即兄，…， 

i — \ 

X n 中取正号的个数.在 H 。 下 B 的分布晕参数为 n 和*|•的二项 

分布给定显著性水平 《， 可确定整数尽可能 

大， C 2 尽可能小)满足 

P(B^CO<j, F(B>C 2 ) 

* • 

取 W ={ 0 ， 1， …， CO u { C 2 ， c 2 + 1 ， …，; z } 作为否定域，当且仅当 

时拒绝 H 。. 

n 

同样地，若要检验 H : F (6 U =^ ，只需取统计量5= - 

z=i 

洗），在下它有分布6(«，1 一 />。），由此就可确定检验的否定域. 

符号检验是实际工作中一种常用的检验.例如，在进行某项 
对比实验时， X 是未施加某一处理①的记录（某一特性值的测量 


①“处理” ( treatment ) —词含义很广，可以指某项设计，可以指某项工 ; 艺，可以指 
某项手段，也可以指使用某种药品等等.“处理”可理解为“措施”. 


1/^4 

10 ^ 



值）， Y 是施加某一处理的记录.要判断有无处理效应（即判断施 


• Jk — • 編 %L Ab 齡 M. _ 龜 龜 — IhaHHHMadlhl I —W. ■ ■ ••> • —. —- ■ ■ I ^― 

加处理与不施加处理在结果上有无差别），常研究随机变量丫一 

X. 若无处理效应，则 Y 与 X 有相同分布， Y _ X 的分布 FG ) 是关 


于0对称的，因而 F (0) = 


以 H ， …， n 为样本，考 


fe-fe* -l>A. 7 ? 人 t>m FTC 


•tr T7/rv\ — 1 . w tr T7/r\\ \- 1 

n 0 :r — —^ni : r wy T 了 

■ ■ 

^ rU ^ ttt m _ B * - fc 6 . fiA . rfet y±f zj rilil ikil nkc-^r hkrmidr r^t 

八 j Wa h j rn i \r *^ 7 1^3^* 右 tj /t J i o, 只 1 j 方 1 j 印 I t %l ysk.)^L* 

例 8. 2 某工厂为提高某种产品的质量，对生产工艺进行了改 

■rfkr Vl ▲ 一 ^ 4-A^ttA. -44 - 一 AA O 曰 "3KT t I, tl^ -i~* -44 - 一 AA d 曰 ‘ -rJt. -fc* -i/^ 

文 • >y j 悝现取[丄乙 rw 厂的定 i ^ kw 尔丄乙 pm ; 厂肋灰里洲书以 


进，随机地取一新产品和一旧产品作为一对进行比较，共比较了 20 

I 、 — t f L 一 ■ A y ££ I •• ■ I ， ■ 1 ■蠱 « A »,— 麵 _!■■— t*t 丄 一 ^ “ •• ■ 熏一 11 ■* w •—» ■ 人 - 丄 一 ^ 、 

M. 记求 5U m” 十 " 衣 7K 新广疝壯， ” 一 " 衣尔旧广品壯）： 


-1- . — . — . - I - . - I - . . -\ - . -\- . — . -1- . - I - . -4- • — 

■7 7 7 » 7 » 7 > 7 « 7^7 7 1 7 » 7 » 7 

+ » + '，+ » + » + » + » + 

检验问题是 

Ho :新旧 产品质量一样 :新 产品比 i 日产品好 

* 

对此可用符号检验作单边检验.用 B 表示观测结果中“ + ”号 
p 个数.给定显著性水平《，找尽可能小的整数 C 满足： P ( g > C | 
HoXa . 取 W ={ C , C + 1 ， … ， 20 } 作为否定域，当且仅当 BGW 
时拒绝 H 。. 若《 = 0 . 05 ,査本书附表 8 知 6 = 15 . 由本柄的实际结 
果算出 B = 16 > 15 , 故否定 H 。， 如认为新产品比旧产品在质量上 
确有改进. 

(二）秩统计置 

定义 8 . 2 设 Zi ，…， Z N 是来自连续分布 FO ) 的样本，其次 

* * 

\ ^ n ■■感 «•_ . Ml 

序统计量记为 Z ⑴ ‘… ‘z( w ， 令 

Ri = min{k ： 1 k N 9 Z t = Z ik) } (i=l ， 2 , … ， N) 

称艮为乙的秩. 

定理 8 . 2 设 乙 ，…， Z N 是来自连续分布的样本 ，尺 ，…， 
R n 分 别是乙 ，…， Z N 的秩，则随机向量尺 =( 风，…， A ) 在集合 


— 1 /y r . 

•丄 VO • 



A — {7 •* 7 是1，…， iV 的一个排列 } 

上均匀分布，即对1，•••’， iV 的任一排列 y 有 

P(R = 7) = ^ (8.2) 

i \ : 

证明：设 7=( %，…， y / v )6 A ， 则 

， ， _ ^ 擎 mm , ■ ■ ^ — 

P(R = y) = P(Ri = /i » *** ^Rn = 7n) 

= P (( Zl ，•- , Z N ) = ( Z ( h) • , Z ( y M ))) 

A • ^ 

=‘ p (( z di ，…， 、 z dN ) = (z ⑴ ，…， z ⑽）） 

= P(Z < i l … 〈 ^d N ) 

其中 4 是数/在排列 y 中 1 的位置，即 :="• 又因 （厶， …， Z N ) 与 

■ ! 

(' ， … ，乙 N ) 同分布，所以 

P(R = y ) = PiZ l < Z 2 < … < Z N ) 

这对一切 y 6 A 均成立，故 （8. 2) 成立. 证毕. 

豳 ^ » m » V m ^ ▲巍 編 ^ b m tf * ♦羼 — _ 秦％ • 'V # 

由定理 8. 2知，仅依赖尺的统计量 i (尺）对任一连续分布总 

体有固定不变的分布.这一类统计量称秩统计量，在非参数检验 
中有广泛的应用.最常用的秩统计量是下列例 8. 3中的 Wilcoxon 

rtrr 狄 J 丄旦 

H 里. 

例 8.3 在对照实验①中有两个总体: F ( x ) 和 GG ). 兄，…， 

I 

•xr rra Ai-r 上 z- -trrt >m.t A+^ / >-» n -^4^ *iu y 、上 JJiA — L- t t ^ r F=l t*l 

定对 jmmou 观测但，匕 iu 定术目 ru ：) 的忏牛 • h ，…， l 定处 
理细的观涮倌.亡们县本白 r ; ry 的垤太 _ 掄脍 问颍县 

，星 • »-» ^ W I I ^ 7 | I -4 y FS ^» ， 1 |— » " V _ • r ■ • w - j - I 

H 0 : F ( x ) = G ( x )^ H ! ： G ( x ) = F ( x - c ) 

f 甘 cb 且不田 M rtr 、 

\ I ll ^=t aa^ /jx. y • 

将兄， … ， Ui ， … ， l 这 m + « = iV 个随机变量混在一起 

* 

-Ufc / II Wv 2Cll -I--Hfc 7；il \ 士 A4 - 口 -P 士 从讲 

: m 卜厂 r v/yv/jwj 八 h 卜 w 幻 '土 a 、 j 迎口、」沉： 

«• 

Q " …， CL ，尺1 ，…，凡 

< 


①对照实验在工农业试验与医学试验工作中常用，它的含义是：将要观察的个 
体分为两组，第一组的个体不施加某处理，第二组的个体皆施力1^某处理.试验巨的是比 
较施加某处理与不施加某处理在效果上有无不同.此时第一组叫做对照组，第二组叫 
做处理组. 
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Wilcoxon 秩和统计量为 


w = 

r t=l … • 

11 ^ 

■ t ■ *^rrt t _ ■ t* fr v » » I ^ 1 tv vf 上 . irt^l wt v 1 . 人 I _ . ■ 1 - 、 J _ » I . 11.1". I I 一 fri 

亘观上口』以有 m ， 右汁刀具，则 w 的俚 m 谈比牧 x . 田疋埋 
8 9 4 n ^ T n , ...,n *... p 的庇各从龙县白各施奋始 

w — yw 7 ^ *u I ^1 y y 气 m 7 表各丄 7 T-^^n wvt/v §_i ■卜 *yu 卜 'v y 

i 

W 有确定的 分祐. 给定显著性水平 a ， 可确定临界值 W ( a ; m ， n ) •当 

I 

口 /口业 TI 广 、 TI " _ „\ Drf - tKZs 4 i ZJ Tir 七 IM + 主7?|| 山 "T 典 RFfiViilA * 田估 

j=l lx=i yy ^-yy \ ajm ^7 uu ^ jti^ci 干 ~ ppi ， j 双 : xy 山 j 巾 mpy mw 夕 ria . 

例 8.4 用两种材料 A 及 B 制造同一种产品.今分别随机抽 

4 

Tlt« -tf* -T - 人 、 ~U* Z 一 t I* / . A * -L*^ ， Ar- l~f t*t . Zkt^, / /r%l J*k-> 1 口 r^r? 、 .1 /Ln -ml Aii. 44P ~rM 丄 " l * 

取右丁 I ' 边 ：1 了 CL 权，仅广而目 EVWJ 3 W 5 虫皮；从为到 VLflt^UMU r : 

mR . mmA.A 

^ / — ，一 一， —— x — / 一 — x 一 一 ， — * 一 —，一 一 ，一 —，一 — 

(这里 B 表示材料石制成的产品, A 表示材料 A 制成的产品） 问: 

^ 、 

而 iib 士十电1糾本且扣 t 台呤右午" X 13甚^ nifn 9 

n ti f V 4 n ^4 ) mm I 工 wcrn ’ i"j m : 

此问题可换成双边检验 问题： 

# 

H 。： A 与 B 两种材料效果一样 : A 与 B 效果不同 


用 Wilcoxon 秩和统计量作检验. W 等于 B 材料产品在排序 


由的砗少知給宙品蒌株 7 k 軍碓帘临 思倌 W , 知 

I »-i V r LX V ^ , I n • ■U r -> -T=^ •— ，矽， I 〜 7 / >*-r •IHHI ^ I T , 1 ^ ^ 7 ■■ 擎 7 -爭 j ， %T^ 


W 2 (4; m ,; z ) 满足 

\ 乙 / '' 

一 / _ in \ \ ^ n 

尸 （w < ]^^- 

\ \ <-< / / Ld 

n l TXT \ TT7- ia ._ \ T T \ Ct 

ryw w 2 \^ Y ；m9n J 卜 Y 

iL ： R /T7 W〆 W ( i … 7# W、W (i … n^riF ： 4^ U ~^c 

二 I J=L I 人二 I ”、” 1 、 2 ”，” rL } 巩 rr ，” 2 、 2 ，“ / H， j JC. 二。 ^ ^ 0 • 个 
/z^l i-4-» n r txU r\ i r\ -Jk- tt ， AA* tIA* 由 /dtr 4B rrr n n \rr 

lyy^r rn^- i 9 n — o. « —u. 丄 u ，®： w trji 肋开但衣 i 守 w i — 厶乙 ， w 2 — 

- V ^ 

43. 由样本算得 W"=l + 2 + 4 + 5 + 8 = 20< C 22, 故样本落入否定 

» tv - 4 i — * > ^ ■> V w ^ ft %. t 矗 ^ ft I I r ^ ^丨 - »—• m 产 ‘ i—> _-# •—* - * \ • ■ t 

项.获 1 UM 古疋 Ho ，认为 A ，±{ 网柙材科对严品质重骨姬者差并. 

I — \ 效县班妨彳+蜃 

\ — / T'J -J Kl ML 

<K 為 

定义 8. 3 设不，…， X „ 是来自连续分布的样本，随机变量 

1 广广 7 

f 10/ • 





1足| ，…， i；u 中 hi 的秩称为足的绝对秩，记为矽 . mr 
称为 x t 的符号秩，其中是兄按0分段的计数统计量. 

定理 8.3 设 X是随机变量，其分布函数连续且概率分布关 

« • 

于0对称，则孓=4(；0_与|叉|豳立. ▲ 

« * 

证 昉:若 f<0, 则 P(0=O, |X|<0=0 = P(^=0)P(|X|< 
t ) ,P(0=1, \ X \^ t ) =0 = P (( p = l ) P ( I X| ; 若 £>0,则 

P(^= 1, | X |<O=P(X>0, l x |<0 

^ # H # - ii 

rk ✓ 广 V y T 尸 八 

= r、u a r; 

= ^-P(|X|.<0. 

Cj 

= p (0= i>p(ixr< ti 

、 1 人 Avr I »i. S » 

失似观令 

一 - 

j* I • ^ ■— v. jf I w I ^ ‘ 

. 尸 （ 0= 0, I A| : ^ t) = t J (,iP=0)F{\X\^t) 

由独立性定义知 3 与 IXI 独立. 证毕. 

w 

定理 8. 4 .设，…，足 | 是关于0对称的连续分布的样本，则 

: 1 

苴讨 命的朴 粉铱朴畺 , h ( Y , k …. JOT) 扫亡们的餡对砗/?+ = 

，、，，矽 /.LdU t-i v r I v i ^ 7 7 十 、 • • n ， v uu ■■ 鑄 "v *^l-* ，，矽 'ix v •. 

( 0+ ... C >+ \ -to TT ^rtr tV ，. , V 、 BE U ^ Aft 奴由 I 么 女 〆 ： = 

ViM ， … y±\ n j /| 口 gj ； 儿 . 屮、八 i j / 八 P — ~2 0^ 1 口 为 T'J JJ "»H V l — 

i 、 - 1 - - /.-« a _ ( \l , -4 r\ JLL» -LIU 、 丨 A—^ / V A • 

i, — 仕 /i=iy:y 刀 i，z，•••，?！ 的仲夕 ui 工: cy'>jor 仲. 

证明： 由定理 8. 3、定理 8. 1、定理 8. 2立刻可得本定理的 

鑫 _ *. m 

结论. 

由定理 8. 4知，只依赖 )=( ip ( Xi ) ，…， ipiX n 、、与 R + = 

\ » 

« 

(^■，…，只^的统计量： r(^， 及 +) 对关于0对称的连续分布总体 

—•，_■■•■ * 、 * _ * _ %, , ,* #. # . # t - # 」 tat * ‘ _ • ■ ■ ■• • ■ _ w V- 、 t,. # ^ ▲ 、丨 ■ 1 麄 t / i ^ t . 、 , V #_ # I - # t f i 一 * t . 

有回疋小雙的分帀，囚 rrn 刊用这哭犹 tt 重构适天卞忍体分帀称 

性的检验. 

例 8. 5 Wilcoxon 符号秩统计量 

^JOr V … V 曰士占 I 17 / 一、 Aft 择 + I? / 一 、汾口亡々斗你上 ： /) 
叹， ” •，八 „ 疋不 h r v 乂 v 卩 y t 十千，广 v 丄 v 迁狄 ±± 节 yvj T ， J、AA t/ 

(即 F (0—: r ) = l — FO +: r )). 考虑检验 问题： 》 



H 0 id ^ do^Hi ：d > do 


令 I 二 Xi ~ do X 


It 


i. _ == _ ▲ w * _• r* — » ― ^ m 

72)，厶 ，“ •，乙 的符号秩记为 


ipaz^R 


，4>{ Z n ) Rt . Wilcoxon 符号秩统计量为 


n 


= ^ ifrCZ^Rt 

. — 1 
a 

j ♦ • 

在从下 W + 应 有銥女的倌 . Hn T 有确诠的分布，故給宙 

• x 丨 ，严―‘ • 1 p ▼ ，墨 i _ - ， _ 琴 T v » .■’ r ^ ■ 丨， ^ r r 9 ，， _ 

* « * 

显著性水平 a， 有确定的临界值 W+ (qn) 满足. 

PdW + ^ W + ( a ? «) | Ho > <a 

-I ： , ^ 

当且仅当时拒绝仏. W+( a; «) 的值可从特制的 

•* *. •一 * 

表中 査出. ， . 

* 

.在结束本章之前，我们给出下面一个很有启发性的例子，表明 
检验问题的提法科处理方法是灵活多样的广 、、， 

气象学家记录了 1942—1981 年间共40年 Raleigh (位于美国 

北卡罗来纳州）的年平均气温.数据如表 8. 1 (单位: 华氏温度）. 


表 8. i Raleigh 年平均气温 


年 

湄摩 

年 

湄度 

，一 _ 

1952 

# 

60. 3 

1962 

58.2 

• 

195o 

61.3 

1963 

57, 5 

W 

1954 

^ 60. 1 

1%4 

58. 9 

1955 

59. 6 

1965 

^9. 1 

1956 

59. 9 

1966 

58. 7 

t 

1957 

60. 1 

% 

1967 

59. 1 

1958 

57. 4 

1968 

58-4 

1 QAQ 

^ Ky %y 

RQ Q 

\y xy • xj 

1QAQ 

-I_ c/ v 

Q 

V/ • 

1960 

57.9 

1970 

57. 8 

,1961 

58 - 7 

1971 

,59. 0 


年 


湄麼 


年 


湄度 


1942 


943 


1944 

1 

1945 


TQ/1 


1947 


1948 


1 QAQ 


1950 

1951 


61. 0 
60. 6 
S9 . 8 


60. 3 


60.4 


59. 1 


59. 8 


4 


59. 9 


60. 1 


1972 


c\no 


1974 

1975 


07« 


1977 

1978 


1Q7Q 


1980 

1981 


58. 5 


59. 8 
$9. 7 


59. 6 


RQ 7 


58. 6 


59. 1 


R 8 R 


59. 3 


58. 3 


1 /?n 
10^ 







以时间（年份)为: r 轴，温度值为 y 轴.可在平面上画出40个 

里 . J M 级- 詹 ■ . ■%. ■ Bk — V ». %. ^ -.^^. 备 ■ 獻 身 - <k #■ 土 w \ ^ f 

点 c 俠谓敢点 囝） . 由此叫以近似看出，平均气温有卜降的 . 趋势 • 

现在 问：如 何料断 Rddgh 是否真的在变冷？ 

对此问题，不同的统计学家可能利用不同的方法进行检验，这 


是因为大家可能做出了不同的假定.如果我们采取尽可能弱的假 

N 

定，例如不假定温度服从任何特定的分布类型，则可以将40个数 
据看成一个随机的排列.任取其中两个温度，可也构成一个“对”. 
更具体说，设第 i 年的温度是 :• = 1942,1943，…，1981 ) .‘称 

f “ - . \ ^ J \ 曰 44t 2 田 A/t … . 4^ / .. J 、日 ~ZT 4rfi 二田 bH 

\yi，yj // 疋似 口、 j '， 石 yi^yj ; a yi > y ; j ： j v 乙、 j / 疋 ， i 、 咖 ^ri 卩 y ， 

若: y t >%. 设“协调对”的总数是，“不协调对”的总数是 M 2 . 
M ^ M ：- M 2 . 从直观上看，若 & M 2 偏大则说明有变暖的趋 
势，若比从偏小则说明有变冷的趋势.若]^与 M 2 相差不 
大，•即 | M | 靠近0时，则表明无变暖或变冷的趋势.设 H 。 是 假设: 
无趋势.则据上面的分析，当 I M | 较大时应拒绝 H 。. 这个检验法 
是合理的，但 | M | 多大才应拒绝 H 。 呢？即如何确定临界值？注 
意 n 个不同年份的温度共有幻种排列方式，在 H 。 下，它们应是 


等可能的.因此，可以这样定义概率空间 ⑴ ，歹 jJ 3 )， 其中 D 由所有 
的排列组成(共_个元素 ） r A X 3 的所有子 JI 组成，而 P 给予 D 


的每个元素 以+的 概率.有了概率空间，就可得到 H 。 下 M 的概 

n\ 

銮斗布_亦太你 I 由 77 = 40. i + 笪銥簦拙_枏抿 h 而的40个教抿.计 

I ， ■▼ , ，圓 •■- I IX ^4 I •, 扉 7 丨 ■ ,*■„,> r-i ^ •’ I / , I 

算出 M 的数值;是一 329. 但经过理论研究，在 H Q 下随机变量 M 
不 超过一 329的概率小于 0. 001. 因此在检验水平 0. 001下应拒 
绝 Ho . 换句话说.，在 Raleigh 年平均气温有下降的趋势.（此例摘 

自 The fassination of statistics , Edited by R . J . Brook et al . ， 
p .161 —172, Marcel Dekker inc . 1986) .所用的检验就是所谓的 

Mann trend test . 




设 Xi ， X 2 ， X 3 是来自 Bernoulli 6(1 ， />) 分布的样本，检验问题 


_ *1 nr\ 

• 1 / U • 
































的一个否定域为 


W= { (xi jX 2 yXz ) : 工 1 + 工 2 + 工 3 ^ 2} 


试求该否定域的第一、二类错误概率和■时的功效. 

-j _— - , - Hi Jill iM ^ ^ 汽 / 、 # 免 — _\ I 倉 - , M ^ 庸 \^- ^^ 、 

Z. 坟 A 〗， A 2 ， … ，是米目嵆皮凼釵方 /d) 的思评的怦不，天卞 jKx) 

有假设检验 问题： 

H 0 1 fix) = fo ix)^H a •: f(x) =/i (x) 

其中/。（0：)和 /〆:《:) 都是已知函数，令 W 为假设 H。 的否定域，试通过/。（: r) 
和/，!：)表示两类错误概率.（/(^:^不恒等于/^：^). 

* 

3. 设X是 j 上的均匀分布的一个观测值，考虑假设检验 


问题 


H 0 16 ^ H a ： 6^ 4 ： 


构造检验法，使其功效函数 〆 仍满足 

pdO , 当沒 < 3;〆 们 =1 ，当 ^^4 


(即两类错误概率均为零） 

4. 设随机亦量 X 的分布密麼可取下而的/；(^)或 A (^) 

曹 ■ _ ■-— w - L. — — m m ^ » ■ -■ - ~ - m m ^ — -— ^ 'W ■ m m m 丨赏 、 _ w m ' _ ^ ' 


fo(x) = 


lo, 


(2x ， 

f\ (x )= 

， • 

l 

l o，‘ 


u 工 \ 丄 

其他 

0 ^ X < 1 

其他 


基于一个观测 X ，来回答检验 问题: 


"W *w ✓ v 六/、 ▼ ▼ r% jtf v 内 /、 

H 0 if^x) = f 0 ^x)^ti a ： f(,x) = /i (,x) 

取检验水平 0.1， 求出使第二类错误概率 /? 最小的检验法. 

5. X 有&布度 /(« r ; 汐），汐未知，* ri ，工 2 ，…，工 n 为 X 的# 

本，考虑假设检验问题： 


H 0 ：d = do^Ha id =d\ 

其中 氏今仍 是给定值.设为给定的正•常数.记 


n 

L ( xf 6 ) = JJ /(:^，汐 ）（z = (xi ，… 9 x n )) 

1 = 1 

考虑如下检验法 f :当乂、(工，兔）>乩（工，氏）时接受//。，当 aL ( x 9 ff 0 )< 




时拒绝 H。， 如果 aL ( x ， 艮仇）、则既可接受 H。 也可拒绝 

riMnaa # ， 

V 

T T yrL * 、f 1 <v » JLi^» jMt — 、！/• UM ^、a Jjla* ^rtrt 、*TT t-»_L t 十 -LA^ V-L. <v u- r\ JLL. cv 

^o. 议 or，/5 7U & 的乐 一、 _* 失话庆慨半，士思怔 ® 拔 d’ ， 石 a ， " 刀 0 

的第一、二类错误概率，必有 

< 

ua * bp* ^ ua bp 

6. 设 X 〜 AK"。，〆）#。 已知， U 2 , …， A； 是 X 的样本.试分别求出 

下列烚验 IB1M 

I ，竭 1-^* ^ j* f v / ■ 

^ I 

(1) H ol a 2 <aWH al a 2 >aliao 已知） 

(2) PW < a ? 或。 2 >^札：。?</<4 

. * 

* 

KO\ ,(72 已知 »(7i <CT 2 ) 

的 UMP 检验(检验水平为 a ，以下各题非特别指出者皆同此). 

1 

7 10* V 〜 M ， “ 1 、 V V … V 且 V i^t 任士 分秘山格必广 nSff 

，• fex. - 八、户，丄 / , 八 1 ，八 2 ， ——, 7^ 八 Ply T~r 于， U_| 

A 

Ho :或 fX^fX2 ^Ha ：fJti <ifjt<ifJL2 

( 'fl\，flZ 已知，户 i 〈户 2) 

的 UMP 检验. 

8. 设 兄，不， …， X„ 为参数 A 未知的 Poisson 分布的样本，试选适当的 
检验水平 0T 求检验问题 

Ho : A = Ao-F/ a : A^Ao (A。 已知） 

的 UMP 检验 • 

9. 设 H， …， X„ 为参数/>未知的 Bernoulli 分布 6(1, 夕）的样本，试 

诜话劣的烚跄永苹。龙烚跄 IB1M 

^ ^ T, —f P-* 1-^- ^ "'!■* ，嫜， | » ^ ^ ~dm | , 

Hq ： P = po 4 ~ ¥ H a ： p^K 1 po ( po 已知） 

的一致最大功效无偏检验 (UMPU 检验). 

10. 设不，义 2 ,…，兄是[0,幻上的均匀分布的样本，求假设检验问题 

Ho ： ^ = ft) H a : 6 do 

的 UMP 检验. 

» ! 

11 V. . V. ... V 旦 \7f … 1、的详太 

丄工 • ^ ^ 1 » z y ? ^ x <n- ac. 必 , 丄 攀丁 r ~r^ 7 'ijs- y vi /co 

H 0 ：// ^ 0^ H a i juL^> 0 > 

(1) 求出 a = 0.0 2 5 的 UMP 检验，并求岀其功效函数〆 //)• 

(2) 为了使 /i^0. 5时上述检验的功效 p(fi)>0. 9,样本量 n 至少应取 
多大？ 

r 

/ O \ /rff 〆— A 1 Orl- _/ r\ AA1 佐士县 “ 式 /1 、士 Hh 夕小 O 

VO/ yv j 15C (JL^i W. 1 M'J uui , T-t-^m " 土 / 此 *^ 夕夕、： 

12. 设叉〜州6，/),尤，不广*,^是叉的样本，办是已知芷数 • 



(1) 对检验问题 


找出 UMP 检 验法; 



H a : C 7 > 


(JO 


(2) 对检验问题 

' * 严 

Ho ：a = ( Jo^Ha ：<J <i (7 o 

item TTMP 於胳吐 . 

ULI 上 r^SL 9 

(3) 证明对于检验问题 


H 0 *a = ao ^ H' a ：< y ^ f (7 o 


不存在一致最大功效检验. 


-i o i4-» trJL nA. A*n //i* it xr/ 2 、’ _ i i- 2 r\ /\ r 44 - -lx -fdr ^r*r j-**. 

丄 。 • ffl 赶题 ; W 禾令 IT 里里 A 〜丄 -^U. ^ 。，仅小平研 , 口 , 

抽了 6 个样品.，测得重量(单 位: g ) 为 

1 A 7 . 1 R 1 . 1 A R.1G 0.1 R 9 .M fi 

2. • f y ^ \y m y ^ y ^ \y ^ \y f jl ^ v 


已知方差不变，问平均重量是否仍为 15? Ca =0.05> 

、 1^. 设 C ( jt ) 是 ri 个自由度的 t 分布的密度，即 ^ 

— * "■ ^ —- W W W ^ W r ^― - r ▼ p ▼ » w ■'W V 

' rf ^ 1 ) , 一迫 ： 

r ( f ) v ^. n - 

试证明 

lim f n { x ) — — ^=.e~T (对一切 ( — OO 9 + oo )) 

—^ LC% 

15. 设 为正态分布的样本，对假设检验问题 

」 Ho %fx ^ \ Q *^ H a xfx <i 10 ；■■ x { - 

求出水平 a =0. 1 的 UMP 检验，并求#=9时此检验法的功效，求出"=11时 
接受风的概率. * 

tm M m % ^ ，息 - _ ■ _ 鬈 ■ _ W B* -- A. f ■, 身 W ， s 

lb . 从呆止念思体干捆取 J yT 奴据，侍 A = u .4, 


s ^ J -^ Yax.-xy = lo , , 

、 n — 

在水平 0. 05 和 0. 01 下分别检验 
(IX Ho ifl ^ O^Ha : / UU >0 

(2) Ho z '/ i ^ O 4 -^ H a : //< C 0 

德释 结果的意义.如果样本量增加到了 25,而统计量 X 与 S 仍分别为 0.4 

一 * hi 八 _ 1 ? x 1 1- ■ m } 上 L I. A T* A. 、人 、 \A ■ *t1 /_ j ^ > i 1 _#. A<_ » 

w u ， 丹近仃上囬的极軀 开讽明 结罘的蒽乂. 

A 17. 某糖厂用自动打包机打包，每包重量的额定值为 100 kg ， 每天开工 

-I ^7 O 

• 1 / t 3 • 




后需要检验一下打包机工作是否正常，即检査打包机是否有系统偏差.某曰 

TT * — r - .> 0*1 Zpa r \ 丄 L * 曰_ / Al ^ 1 、 、置一 

tt 丄历测恃 y mtw 里星卩平议： Kgj 刀 

99. 3,98. 7,100. 5,101. 2,98. 3,99. 7,99. 5,102. 1,100. 5 

rVTt 汰口： tT>frr 士 n-r/ 4 r 且术 re 也 o (一 — a AC - 口 4 cn 知击 BBUtC 太几女、 

i^g : m gj Cio/b 丄 I 卜疋 口丄 l 巾： va — v. \jo ^ /vh ci m/JPC/^\ xu yj ">h / 

18. 正常人的脉搏平均为 72 次/分，某医生测得10例慢性四乙基铅中 

表座若的晚埔（汝 / 斗）加卞 . 

_^r*•—i r -9 ^ ■# 、 V 、 / / 钂 ， 乃 r» V • 


54,67,68,78,70,66,67,70,65,^9 

已知这些患者的脉搏服从正态分布 ，问： 四乙基铅中毒患者的脉搏与正常人 

从吐袖亡工 HS 。 / —/\ 八 c \ 

trjWM 开书儿亚百左开 r va —w. \jo> 


19. 用热敏电阻测温仪间接测量地热勘探井底的温度，重复测量7次， 


测得温度 rc ) 为 


112.0,113.4,111. 2 t 112. 0,114. 5,112.9,113. 6' 

而用某种精确方法测得的温度为 112. 6( 珂看作温度直值），试 问：用 热敏电 

- - *■，▼『， r m ■丨 ▼ w ▼ »■ m "^― ’ 了 ▼ ， -W ，【 ~W 1^ ▼ F * ■ ■ ， W — - ▼ - — 

阻测温仪间接测温有无系统偏差？ (a = 0. 05) 

20. 某工厂采用新法处理废水，对处理后的水测量所含某种有毒物质的 
浓度，得到10个数据(单 位: mg / L ): 

22，14，17，13，21，16,15,16,19,18 


而以沣闲去法々卜捆陈水后.该轴右表物席的平抝浓麽为 19. 问，从对汶神有 

■ - •，， ， — , _，『I _ 、 ^ r I—f , 、 I ■ ，— ■ ^ I ▼ < • ^ ^ — — » ■_■ ，， , , - ▼ > I » 1 

-Ax ■* f i 上 L LI _ f ■ ■ , I 一 t r ■ I=t ■ a * • I . 」 t*^ 、^靂 1 為 j jnnf . 1_^ 美 ' 八 八户、 

苺籾灰的处埋米有，新法是古 it ; 宅法双罘安圩？ u = u . ut )； 

21. 有某种导线，要求其电阻的标准差不得超过 0.005(0). 今在生产的 
一批导线中取样品9根，测得 Sf =0. 007( fl ), 设总体为正态分布，问在 0. 05 
水平下能认为这批导线的标准差显著地偏大吗？ ’ 

22. 某机床厂某日从两台机器所加工的同一种零件中，分别抽若干个样 

测量苓忏 KT ， 得 < 

第一台机器的 6. 2, 5. 7 ,6. 5, 6. 0,6. 3,5. 8, 5. 7,6. 0,6. 0,5. 8,6. 0 

« 

— - / 、 4*M m* AA* n r> n r\ n ]r* n nn/*/\n>nnr7rr 

带一 百饥研 try o. o,o. y ,o. o ,o. / ,o. o. o. u ,o. o ,o. / ,o. o 

问：这 两台机器的加工精度是否有显著性差异？ （ a =0.05) 

23. 检查了 26匹马，测得每100 mL 的血清中，所含无机磷平均为 
3. 29 mg ， 标准差为 0. 27 mg ; 又检査了 18头羊，100 mL 的血清中含无机磷平 
均为 3. 96 mg , 标准差为 0. 40 mg . 试以 0. 05的检验水平，检验马与羊的血清 

> 6 >^ -T^ -LJ-t t 4 I£. 上 £• S t =3 —wr^ - fc» • 1 _»I, l=f. 一 

肀百兀仉辨的重定货令並者12麦并？ 

^ 24. 10个失眠患者，服用甲、乙两种安眠药，延长睡眠时间 （ h ) 如下表 


■% n a 

1 • 



所示： 

患者编号 1 2 3 4 5 6 

甲安眠药 1.9 0.8 1.1 0.1 —0.1 4.4 

乙安眠药 0.7 —1.6 —0.2 -1.2 —0.1 3.4 

患者编号 7 8 9 10 

甲安眠药 5.5 1.6 4.6 3.4 

乙安眠药 3.7 0.8 0 2.0 


问 . 汶荫轴安 BE 芘的疔榦右干搿荟桦卷豆？（可 WiJl 为服用而轴害 Bg 芘后楢 

■罅箏 ■，寸 II V V ^ I ^ 《 _mg- ， F^V V— >1■ 邏 ■ . / ■ ■ 、 • yW ，■"#，， V I 舄 〆 V / •—t ▼ l-f 

加的睡眠时伺之差近似服从正态分布， a =0. 05) 

25. 比较甲、乙两种安眠药的疗效.将20个患者分成两组，每组10 人; 
甲组病人服用甲种安眠药，乙组病人服用乙种安眠药，如服药后延长的睡眠 
时间分别近似服从正态分布，其数据仍如上题（这时数据不再有成对的关 

-TT \ • 、 —1、-^ tuT vtEH 上 ‘ ~r^ » -ktr III, C=t, ^ / \ 八 r 、 

尔 hiRj 込州竹文眼约灼汀5»另兀並有1土左开了 Ka = v . voj 

» 

Yz >* # * fYm m y 的样本 • 试用广义似然比方法导出下列检验问题的具体否 
定域： 


27. 


Ho : /xi 






a :"1 


in 


设兄，^，…，；^ 是来自指数分布 


(已知 a \ = a \) 


/(工，汍)=^-彳 

y }\ 

( o :^0) 的样本， K ， Y 2 ，…， K 是来自指数分布 


nJo 9 d 2 ) = f - e - r 2 

U 2 

( i 彡 0) 的样本，且两个样本相互独立.这里沃，爲是未知的正参数. 


(1) 对检验问题 


HotOx 


4 . ~^ 


W fl tdi ^ 6 z 


找出广义似然比检验法. 


n 




(2) 证明上述检验法的否定域只依赖于比值^ 
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(3) 你能求出统计量与^在 H 。 下的分布吗？ 

1 = 1 

28. 在一正20面体的20个面上，分别标以数字0，1，.2,…，9,每个数字 
在两个面上标出 • 为检验它是否质地勾称，共做了 800次投掷试验，数字0, 
1，2,…，9朝正上方的次数 如下： 

物穿 0 1 9 1 R 7 8 Q 

频数 74 92 83 79 80 73 77 75 76 91 

问：该20面体是否匀称？ 

一 -■ ^ r ， - 冒 w ~ 

29. 试用柯氏检验法检验下列25 .个数据是否来自 N (0,1) 分布 （ a = 
0. 05)： 

_ 2. 46 . - 2. 11 — 1. 23 —0^ 99 一 0. 42 _ 0. 39 _ 2. 21 


-0. 15 一 0.10 —0.07 -0. 02 0.27 0,40 0.42 0. 44 


0 70 0 R1 0 RR 1 07 1 穴 Q 1 AD 1 A7 1 R? 1 .RA 1 7fi 


30. 在对 UFO 的调査中，査问了 1 2,76个自称看到飞碟的人，并按他们 
看到飞碘的地点及飞碰的形态讲行分悉，结果如下： 


看到的飞 
碟的形态 


看到飞碟的地点 



在西班牙 

不在西班牙 

停在地上的碟形 

53 

705 

—t*. Mrt 1.U T#l^ XIV 

g-\ 

66 

d -% 

41 乙 

其他形式 

' r ， 

9 

59 


检验“看到飞碟的地点";与“看到的飞碟的形态”是否独立 （a = 0- 05)，并说明 

I 1 

丄人 T* A _i_ A t-rf t=t — I J- 、一 》* ^ 一 》 —• ▲ 一士 , • 巍 ■■蠭 M - » .ft 

恆狴的 2 S 罘是叉狩迚是汉对^锞的仔在彺. 

31. 甲乙二人分析同一气体的 C 0 2 含量，当二人的分析数据没有个人 
间的差异时，应有相同分布，从而“甲的数据一乙的数据”的分布 ■ FU ) 关于 

a 守士 势 ttt m 竹 _a 仏必处仏必 nr I?/a\ — 1 zfeh 太 chtiu — A 

\j A'j ^iiouwjj — ^ n no 9 一 y \ 

_ 

66 乂 ViP 姑里右曰-某老© ; 士田 "FT Hif 介湘 rt 来 6 riB>Cfc “逆 换必 ，格路士亚办= 

ug yj |/1 ^-R >T^ n -HU 令 7T • KWy / IJ I WJ 从 w I |- 」一 XXI rut \ UK. ^»SL 人 JV I u 

0. 05)： 



甲 14.7 15.0 15.2 14.8 15.5 14.6 14.9 14.8 15. 1 


~r 1 >1 n i r i 
丄吒 ，O 丄 O •丄 








甲 



1 a a 

丄 t ♦ \j 


1 r a ^ a n i r o i ^ n i a o ^ a /y 
ID . 丄吒 • / 丄 0, 乙 / 14：. O 丄吒 • O 



14.7 15.0 14.9 14,9 15. 2 14.7 



15.4 


乙 14.6 14.6 14.8 15. 3 14.7 14.6 14.8 14.9 15.2 

32. 用两种材料的灯处制浩打洵.设甲材料饤洵的寿命分布为 FCi ), 乙 

— ^ f * ■ r v p w ~^ ， ， ， - • * '» • ■" "m •_'， • wtmmrn w—* ， 丨 ' w ~ ' ▼ 、一 - ， 

材料灯泡的寿命分布为 FU - d ). 今分别就两种材料灯泡随机抽取若干个 

进行寿命试验，得到寿命(单 位: h ) 数据 如下： 

nr 1 610， 1 650， 1 680， 1 710， 1 750， 1 720， 1 800 


乙材料 . 1 580, 1 600, 1 640, 1 630, 1 700 

试田碎知給胳法於龄而轴讨 魁甜打 询卷合的嵌晌右子 S 荽巷 S ? (檢胳 

/ _ n l-sa* -Q f r ^ 9 V f ^-4 ■雾 I ，，磉 I W r*r» " V W / I * / ■ 、 l-U* 


水平 a = 0. 05) 

33. 设两样本不， …，； C 


癱 ## 


, y , 一起排序得到的秩统计量为 （ Qi ， 


O。 •… .Ol . 7 ?。 • •“ ./?_) . Wilrnxnn 雜和统 i + 醫 W = ^ R . . 试 iiF 明 

, / 7 一 -1 , 一 ，4 r , , «, r ▼一了 ^ ■,, W ,署 ^ _ r / J — » I , ， 

1 = 1 

m n 

W =^ i ^ i ip ( Y j - X ,) + ^ n ( n + l ) 

i=i ； = i u 

其中 


0(0 = 



i > 0 
/ <0 


1 n n 
1( / • 



第四章回归分 析与线性模型 

»■ - — . -- - - - 



曰 


回归分析是数理统计学的一个重要组成部分，它的任务是研 

tel A/t 4-0 ~xr 4A -a^ Trtc 貝 ‘ -V AA riA. / V —IW /a^ >4 - ZTiY 3W Mil 

兀又里心 I 口 j cpjth 上 l 大尔，理兄 : s: 里乙 i»j 

和控制的目的. 

Al\ tfl 丄 ~44* -n*ir ta \9At^ ■ iri 、隊 \\P . I - ^ I - > - I-t-I t F \ v-r - 上 L ±S4^ "W-»_ Al\ l»l . I—-» 

琛饪悮型定奴埋珧 rr 字甲一用 ~ r 甘 j 忆的悮型，琛饪凹 
问斗拓 1 古荖斗振试賒沿朴氐的粉坭从诟笙规可 w 归士沧轴 趦刑 

/― • I/I 、 JLJL^ y^» 1/ I 、 9^\ r I /I—I HI V JS^ 4/M 1/ I Hr T -4 ，― •i I I^V - =. 

的统计分析. 


/一、 Ttem^F 

I / 又皿 4 i d j nvim 万爪 

变量之间如果不是毫无联系，那么它们之间的关系可以分为 

TTTt ^U* JCil -r/e. r^-t 111. AA / —4^ rC/U. .TST : XU \ I— 44=1 XU -XU 

門 TT 天坐：侧疋 I 7 土大尔、现孙 BS 戮大序 刁个日 大大尔 • 

确宙#婪紊县其匙亦量倌确宙以后另一匙夺量的倌就可以完 

-，1 ， ■ ■ ， ，-^ ，， - - — ^ ^ 1 • -/ M ,， ■ , • ■ ， ▼ ：■■— ： '■» 〆 ■_ ■ ■ _▲ » - ▼ ， _ • ，' ■ ▼ - ， - ， 

全被确定的关系.比如在物理学中，在一个阻值为只的电阻上加 


电压 . LT ， 则电流一定是 Z =^. 


这里变量/的值被变量 LT 和尺的 


值完全确定， J 与 LT 和尺的关系就是确定性关系. 

相关关系是指一些变量的值确定以后，另一些变量的值并不 
能完全确定，但与前者有某种联系.比如一个人的身高与体重的 

%. # ^ M 丨 1 1 % ~ ft % i * • — 」> 東 — ^ * m — ■* 1 1 i 獻 身 t _ ^ _1_ m \, 产 I * 

夭糸.一个人身高越高，体重一般也越重，但身高与体童之 _ 开小 

是严格的函数关系，有些人个子不高，但很重，也有人个子很高，但 
体重不太重.如果记身高为 X ， 体重为 3 N 则我们可以用如、疋的数 

士 、山 — 士 二 — /.'-f -V ivn aa ->A 

子衣 3 ^ 工、衣/」、 : 

y = a ~\~ bx~\~e 






其中 e 是一个随机项，此式说明了身高越高体重也应越大，但可能 
有随机摆动 e . 类似地，一个变量: V 对多个变量，•••，&的相 
关关系一般写作 

y = fCxi ，： c 2 ，•• •，： c p ) + e 


这里 f 是确定性函数县期望为零的随机变量. 

，^ ~ w ▼ r ^ r f - ▼，- » ^ ■'w 

(-) 回归分析 

统计学中回归分析的任务就是要研究变量: y 与变量^，^，…, 
之间的 关系叭 

(1) 是否有相关关系.即 A ，％, …， x , 的值定下以后，: y 的值 
J 1 否在某个确定的范围内. 

(2) 若有相关关系，如何找出适当的函数 /(xi , x 2 ,…， ；) 

y = fix l , x 2 ,*•• , x p )+e (1. 1) 

其中 e 在某#意义下很小.这个 e 叫做 R | 机项或随机误差项，它是 
期望为零的随机变量(如果 Ee 专6,我们可以把 (1. 1) 式右边改写 

i-fr r r / \ I 1 I / p \ r、i 1A- -^rr 上 A iy »£? 4 -n >a 

肌 LJ 、 工 1 ，工 2 ，… ， xyri ^ e 」 丁 、e — ，以 e ~ r.e TF 乂/別"的腿饥跃 

i 项). 

/ A v t 一 ^ . 膠镛曾 ^1 —t _ •_> 义， 1 ， ■产 丨 t 4 ^ V . > . 9 . t . \ „ 、#1 * 丨 !-♦-.» — 

^ 6 ) 卯朱得到的天杀瓦 Ch i ) 干 e 的万差很小，则句 


▲ P / \ - ✓ -I o \ 

3 ^^ JKJOi , x 2 > ••• < iXp ) 、丄•乙 J 

称此式为回归关系式或经验公式，它可以用于预测和控制. 

①预测：已知 A ， x 2 ，•••，％取值为 X ? ， x § ，…， X 》，求相应的： y 大 

约是多少.比如通过分析知道人的身高与体重之间有回归关系式 

y ^ a~Vbx 

^utmm - ， 釐 fc .f 義 V.__ %, t /\ 身 # 、 » » * # > ft 身， t 丨 I ^ /\ 

现知杲人身咼为/，那么茯 IN 就知逼此人体重 X 约为 a 十^ r ' 

m ②控 制：如 果变量 xma ， …， X ,是可以控制取值的，而 y 不 


①数理统计学中对多个变量: yi ，3^2，•••，> 与多个变量 ， X 2, …， x „ 的相关关 
系也有研究，一般列人多元统计分析的范围. 
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能直接控制，: y 与 A ， x 2 ， …， h 之向有回归关系式 （1. 2) ，那么如 
果要控制 y 在区间 ( A ， J 3) 内则可利用 （1. 2) 的关系通过控制 
• r 2 , …， xp 来实现.比如通过分析知道，在对某种产品表面进行腐 
蚀刻线时，腐蚀时间 x 与腐蚀深度: y 之间有回归关系式 


y ^ a^rbx 


，1 r^v X 

U. 6 ) 


现在要控制腐蚀深度 y 在区间 （ A ， B ) 内，则 可禪过 灌制腐蚀时间 


于 l 2 UBj ((；， L >) 内买现. 


I 

* 

• 1 


mm\\ 抬生 iiivn 腼 7 汗 外本命 跋啓 tch 丁你笛一纪企卡 ibt 

4J^\ US'J \ J 丄 IM'J H Z'J TT~. ) a TH ~J~~ Z^\ 、 S - <zt -J— I r* "TT V I JJ M=M 

贅 

鄱有重要的应用 价值. 

" * - * - V % 

包士於 nr 命 Tfr: 县 ivn 糾扣斗岁腺 o il Mnrm^ 儿砂 议 

兀又里 I 口 J 口 : ； TH^C ； 7C 尔 7 匕 ：/yvisjy 枉于、 Ki 十、:土 T 刃于、过 

济学\社会学等专业的理论常常只能得到一些定性的看法，有时连 

• * 1 / * • 

1/1 ^ JUU : vJ- #L» Al=i —TTil -rtrl /▲ 、 I S^A. JLU -fcH —1^ —T? Crt_ M It Xt=t > t > i t 、 秦 *TfT 

疋仕 tf 、 jw7* ： m 恃 个到 . 戮牲现 rr 乎 m; 巷牛于校定从级惦 m 汉 w 九 

汶些问颍.拖句铳谥.县诵讨谰杏或讲杆辄尝 窀腧莊 渴女蜃教抿并 

* ■ , ，, , F ™ » V ^ r r ^ m^r ， M T * ―^ ^ I r _ ， _ _ ， 、才一，，、,_，，， ■ fc 、會 r-i ^ I 

在此基础上进行科学的分析以回答上述要研究的 问题. 

1 • ■*•'•• 卜 ' • . . >1\ . ■ ' 

同归从 * P 垂亜的粉描 miM 万 || 赤一小志、 fil 志 1 1 

卜 ~4 y—I /V l/l MU - M 4/pi ■ M •» y r 4 H^L I -^V 7 



其中: y z 是 


勾 1 


Xi 


G = l ， 2 , …， w ) 时的 3 ; 的 


观测值，一般要求观测值数〃大于自变量的个数夕. 

(三）回归分析的两种观点 

回归分析的出发点是表 1.1 那样的数据.这里变量3^—般 


•% C% 

• 10U • 





是不能人为控制其取值的，只能通过观测得到，回归分析中把它 
作为因变量.变量 A ，&，•••，.< 有些情况下可以人为控制取值， 
有些情况下也只能观测得到.由此就产生了回归分析中的两种 

/1 \ +m 占命且 — — 主 斗 始 +n APt ^ >as TfrzM. ixi Tfrt 且 ^ 

、 、丄 / id 日艾里工 1 ，工 2 ， ■•• ，工户泪肌 qpwaiyLtnj 百； ia ： x: 里，四文里 y 

着成随机变量，这称为第一类回归分析.如果:的取 

Al^ 1=4 * 1 、> I 上 JLic irtil 、丄 -tl* -tnt I— I faN 丄 m m JLU A*r 口 

但足人刀保刺的，则込种观 mo: 权日热 ; 义 u 禾： Ci ， x 2 ， … ， x p 則但定 

观湖|措_的.田搵_的敉抿仍与耵以粒制时同榉亘右矣1:1 mm 

『严 W ix 、_ ¥ _ , ■" . " Ii 1 f V ^ ^ ^ ^ ^ ^0 m m 『 ，,, ，、 丨 ， — ▼ — ,,» 

，身 - |v »-**►-• _ Y • 1 、 _ 一 f .•疒 ^ * A • * V ft ♦ A*JL« 、•, i" - • 響 •. * 1 W • ■_■• * 

的肜瓦，执以这时•也 宂全叫 以用弟一买凹 W 米 处埋. - 

(2) •把与5 都看成随机变量，这称为第： i ： 类回 
归分析.如果^ ， x 2 ，•'••，: C , 是观测得到的，则这种观点比较自然， 
但实际工作中人们一般还是用第一类回归分析来处理. 

我们将主要讨论第一类回归分析，关于第二类回归分析只作 
简单的讨论.我们将指出，在许多情形下，两类回归分析有相同的 
计算公式. 


(四）线性回归分析与线性模型 

回伯分析的某本问 M 县，加 何从宪 1. 1 那# 的教椐出发找 

w » ， * / f p w—w ▼ ,_■_« t _ ， , ^ r 一 •_ ， ■w ■… ■■顆 

V ) 式中的函数 / k 得 （ l . i l ) 中的随机项 e 在某种意义下 

最小？ 

- K i _ 息赢 ▲ _ _ • ■•- *1 II _ m %k. 美 k k ▲ __ == ^gk to •鑫 II 1^1 I ill 歎 • I Ik. 一 • k 、 

函数 / 的可选范围太厂丫，难以下手. 如采顶 先假足/是线 
性 函数： 


/X 工 1 ， 


^ p ) =b 0 +^i j：i + … + 6 p x 


( b 0 ， b ”一， b p 均未知），则模型 （1. 1) 变成 

y ^ bo ^ rbiXi - {- ••• 4*6^^ H~e 

^Swp —W 、f ▲ ZUi .UU nrf I -Wr ami Zr4 - _A^ i i AA> 4^ 4d t^T -<B 4*rt ->/* -z? — 

孙心力软 # r 土凹 ia 佚坐 • 矩百衣丄•丄 trj 双俯 ki 1 守 >» j 「大尔 a : 


(1.4) 


3 ^i = b 0 -hbiXn + 6 2 jt 12 + ."+ 6 ji x 1/> +er 
)2 = b 0 + 6 iX 2 i + 6 2 x 22 H - Vb p x lp -Ye 1 


y n = b 0 -^rbiXnY + 62 工 ”2 + … +〜 


(1.5) 





称之为线性模型. , , 

« 

身 t ^» _ ■ 、 • • 蠱 _ ■ - b %., * >i a. II * % m m » fc ▲ ^ Jt ^ . % - _ — ― #t* ^ 

，线饪回归分祈的基本问翅就是如何确足 b Q ， b ” …, b p 便得 
(1. 4) 中的 e 在某种意义下最小. 

线性函数是极特殊的多元函数,但线性回归分析却是回妇分 

忙田县击苗 a?i 厶口 cfc 如八 ^ m ^uiu nHo rsm-tr -T- rr\ m- rm ir=! 
Vi 王取里 ： 5CPiyai>w 口 h>yj • Ji 疋 yv 11 7c* i — ^ : w 从 ■ 工 ㈡ y_i 

模型在数学上有成熟的处理方法，线性代数的工具可以发挥其强 

_L* JUU «=1^ 丄 >-X* I- -A- r^L 卜 ^ vl 知 /V 二 fcr ，- rrn 1 1 > 士 /77\ l/^L 、 l/ 山 一 T - /yf H 

人 tryj® ((刀，込 一 仕牛^早十付兀 tt 衣攻 cq 木•②头咏曰卞个 ix 定 

经 常调剞 线桦回伯樺型.而日砟名韭线桦 ©归 樽铟经付话当的夺 

-w- ■ • w ▼ *■ 、 •■ _ ■ • 罾 ， w \^- ■■ , , • 緊 ， k «*MdMb _ .I — W p ^ ^ pi him m w ▼ / - mm w « w w ， 

" **' m \. W P IP 1 纛 1> 曾 • ■ k • m 1 m ■ _ 麄 ■ * ■ t l j 遍 li 1 ## - •— - - •冒一 t 於 ft 眉 

俠口 j 以化刀线彺凹 W 悮型.这一总规作卯卜 擀粹. 

， m V 1 女联在 搿极由 、相坦 LM 社的怒35^也 M 来登够_ A ，扫 

U 墨 • A I - A -. . 1 ^ _ Mi * / f ^ I 7 |*^V |_ L * H v *^ L = I * y ,1 I / U — ‘ U «|J V 

析出银的光学密度 X 之间有下面类型的关系 

y ^ Ae~ B/jc iB ^> 0 ) 

其中 A，B 未知.这里: y 与工之间不是线性关系，但令， =ln^» 


x 




丄，则 

X 


y * ^ln A — Bjo 


* 


即，与，有近似的线性关系 


一般地 ，一 元多项式回归模型常可化为多元线性回归模型. 


如设 


: y = 6 0 + 6 i :c + •'• + b p x p +e 

则只要令… ，夕） ，就有 

jy = 6。 +办1 工1 + %%% J rb p x p ^e 

即多元线性回归模型. 

上述方法还可以推广.设 

y = f ( xi ， x 2 ，… ^ Xp)+e (1. 6) 

其中/是连续函数，它可用多项式 

( p { x x , X 2 1 ••• iXp ) = 2 ^2 9 ### yip ) x l l X l 2 mmm X 1 ^ 

Z 1 , l 2，•••“/> 彡 0 J 

ij + l 2 + •••+:/> 




_ 逼近.记: 


( pixi ，: r 2 ，… ^ Xp ) 


i 2 


, 则 

〉: ci Ci \ j iz 


l l ‘“2 ，…“ 
i， - hio +***4 

1 l p ， 



是新变量{ 


l l l 2 


} 的线性函数，于是可以用线性回归模型 ^ 


求彳措刑 n fi 、 


更一般地，对于模型 


v = <2a 4- > a:ib:(x 、.jto • ••• 

- \J * ^ _ M - J J X — ^ X ， - 心 ， ， - ^ 

只要办是已知函数，则4^ 

Zj —^ j^Xx , x 2 ,*•• jx p ) 0* = 1»2, ••*,/) 

便有 


3^ = a 0 + >! ajZj + e 

成为线性回归模型. ； 

给卜跖冰.姥杜 fmi ㈡ 港刑的命田县+斗广荇的 乇 了佃；捆 

—■«* /y I 7i—i—I y — I t^r%. mv /_i^* / m — i / k— m v • x v -4 -4 

解，； f 面先介绍一元线性回归，然后系统讲述线性模型的 i 般理 

办县 G 目/女奸公祕 rst iin M 
i^u f -rx/m rr y '4 yu^i i-c ^4 y—1 1^4 


§2 一元线性回归 


(一）问题的提出 


在一元线性回归分析里,我们要考察的 是：随 机变量3；与普 

V 


通变量： T ( y 和工也可写成 Y 和 X )之间的联系.对于: T 和3^，通过 


观测或试验得到若干对数据 


(工 1 ，: yi ) ，（工 2 ，: y2 ) ，…，（工《 ^ y n ) 

在此基础上，如何获得^对 x 的经验公式呢？先看一个例子. 

例 2.1 某种合成纤维的强度3；与其拉伸倍数 x 有关.表 
2. 1是24个纤维样品的强度与相应的拉伸倍数的实测记录.希望 
找岀强度^与拉伸倍数 * r 的近似关系式. 
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合成纤维数据 



我们以 U ，： y ) 为坐标把这 24 对数画到平面直角坐标系内（见 

nrt 八、 - n L、A 上 l r*rt >> L ^. t*rrt > « r*rt 一 - i : - »- • v t — • t • •»—•> U *. r . 黨 L r 4 t - L . 

囵 U ， 孙达怦的囹刀 敢总 囹.从囹^甲 nj 以有 m ， 适@总入伴{敢 

布在某条直线周围，这说明强度 y 与拉伸倍数 X 之间 ‘大致呈线性 


10n 



^ U 2 4 5 8 10 „ \1 

拉伸倍数 JC 

图2纤维强度与拉伸倍数. 
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关系 ： 

y = a~\~bx~\~ e ( 2 . 1 ) 

其中 e 是随 m 项， a 和 6 是未知的参数.下面的问题就是设法取 a ， 
6使 e 在某种意义下最小.我们先讨论一般方法，然后再来解决这 
个例子的问题. 

(二）最小二乘法 

nr-t 、> it nrt - ■ - — -f « v » • t ■ I— 丄 -+-I- Me* -r+r* 人 nr-t • 丄 I、 _Lo -r-ir 

囚刀从囵〒 Bj 以有 m 敢魚邵伎肛呆一汆且琛，囚 ire 矹忠到 M 
肋 /7./ I 你吉线 ^= n A - h ^ r 甚蛀袵阑2由的 M 小占乍垤施昼>怎 

〜 7 ^ ■— L 0^4 1 |«= iu | — ■ p >#^ « 丄 | /、、、 • JUi、I I I^SJ 

直线 ysa+Ajr 与 个点 （ X ! ，:>^1)，0 2 ,3； 2 )，*"，（ > 2：„，3；„)的接近程 
度呢？可用 


Q ( a f b ) = ^]{yi — ia + bxi )) 2 (2. 2) 

1=1 

的大小来刻画.它是直线与各散点在垂直方向（纵轴方向）上的距 
离的平方和 . Q ( a ，6) 越小，则直线 y = a + 6: r 越靠近所述的《个 

点.因此只要取使 

Q(a ^ b ) = minQ(a jb ) (2. 3) 

a，b 

_ 古么 fetzr 琳上 mm 似告 ） IC ITDtV 士笔 A/t 士斗士 说占 士 /o I \ H-t — 

外 s 且级 -J hxaa H J kAiR ^ PJa . rtuii^ppjvyj 広不师 At 丄/丁 trj a ， 

6 , 通称最小二乘法，意思是使平方和最小的参数估计方法.这样 
得到的 J j 称为 a ， b 的最小二乘估计. 

7& 理 2 1 对 w lt& Y& ( nr ^ • v , 、 •（ t 。. v。") • ••• . (nr A v 、 • 加里 l • 

• ，，嘁 I i—L v I 7 1 */ 1 ^ 7 x C T V / 6 ， 7 7 ' Tl 7 ^ 71 ^ ’ I 、 x 7 

x 2 ，•••，〜 不全相等，则 a ，6 的最 小二乘 估计为 

a = ~y — b x 

n 

2 ]U -^)(^- J ) 

b = - (2.4) 

n 

ixi — x ) 2 

i=i 

其中 I 是 A ，…， A 的平均值， 7 是: Vi ，•••，％ 的平均值. 

n 

证明： Q ( a ， b ) = X {% — (fl + bxj )} 2 

* •% 
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n 


刃 + D —( a + 砑 )] — 6 ( a — 王)} 


n 


y ] (yi — y ) 2 + w [夕 一 ((2 + &?)] 


2 



记 


n 


n 


• o \ 飞 / 


■ 、 

X) 


^ Zj 



y)^Xi — x ) 


n 


XX 


2 ： 



, 


n 


yy 


s 


^ I 


rn>l 

m 


n 


7 _ 

l ^y —乙 


— \ f … 

oo)\yi 


Q(a 9 b ) = l yy + n\_y — (a + &r )] 2 + b 2 l xx , — 2 bl 




lyy + n\_y —— (a H ~ &r ) ~\ z l xx [b —— 


l 




XX 


l 




XJC 


>1 


m 

L 


yy 


£2 L 


XX 


要使 Q ( a ,6) 达到最小值必须且只须 

'v = a bx 


n 


2 


\ 


丄八 3^ 


b 


jry 


xx 


n 


V 



X 


因此 a ，6 的最小二乘估计为 （2.4) 中的 L &证毕. 
从定理 2. 1可得^与: r 的经验公式是 


y—u 


~rbx 


M ^ M I— » 

V4. DJ 


其中^，6由（2.4)式确定.在符号 v 卜加的 帽子记号县为了区别 

r T - —w ， W ■ 'W "W ™ — ^ - ▼ W W ~~V -W T ' ▼ ， 

于 y 的实际值 . j 叫做对应于: T 的回归值， （2. 5) 式叫做回归方 


7 狀 


• 100 • 


程，由回归方程决定的直线叫回归直线. 

I 

k ▲ * _» k _ - Mm %. ■蠡秦 ■ — i ■蠢 _ —私 灰 _ » 氣 秦 蠢 - h 

对于例 2. 1的数琚，用 （2. 4) 式可以算出 

6 = 0. 859 fU = 0. 15 


因此，强度3^与拉伸倍数 x 之间的经验公式（回归方程）为 

▲ _ r\ 1 r I r\ o r n 

y —— U. 10"TU. OD^X 

这里回归系数 6 估计为 0. 859 的意义是，拉伸倍数每增加一个单 

n -»i-» ■ 占 v 1 1 I i az. f_ _ 八 a a 、义 # \. 

IS .5 虫反干叼壻那 u . «by T 早 12. 

I — \ 铋杜龙玄的松於 

\ —— / l^u M IA <93. 

有了经验公式 (2. 5) 后，是否就可以用它来进行预报和控制了 


nP_ o 你 /i、n ,i 、， OffT 、 V4 -在 r±trm o i -rt¥ At — T 入切社 i、r /»L 立 ~4* 私 ■!» 并 

y 匕 :：«< iua： , At 往厶•丄 a»j 

没有作什么假设，因此给了任何一组数据，％ ) ，（右，: ) ，，••， 

^ V. — ▲ I k _ _ _ ▲« ftl w ▲ w ■ • V . 丨 > I* - ■ • ft ♦ t V 黪 ▲ ^ m M 蠱 *■ rnm^M 龕 • 

U „，％) 郡 句 以用公式 （2. 4) 釆计昇最小二来佰计 a ，6 从向得到 3； 

•* 

in t -> lot 66 — 木孩胳 / 入才 HB … t ； 个— l 、5 t 亩右66 

'|H a MV I ZA A ， J^J\ ^ I " WCi t/U J 一 J 丄門 ^?T n M±, \K^\ 

线性关系.如果回归值与真实值之间的差距即拟合误差: y _ ： y 确 

: tor Lly - i^sr ,lv : A '*1 T=rc l W _M JX - I—r __ -V iVn APt T^Sfc -^ s - Z 4^ UU 4 d -AA 冰 

大 flPHi 权 /J、,K IIJ 肌 kA !AyV y JC 乙 |aj trj 哪廿狂软 1 土 th 大大 


系.判断一个随机变量是否比较小 R 能用假设检验的方法，下面 


-TI 、 /. 、一 * _k*h X£_ I. rr*A 、» /.l\ I »t r*-» 、人 、/. « 入 

茯 1 U 肌米构迫这柙恆軀，孙刀统饪 TO 天天杀的恆軀. 

筇们生征昍>小亘右铱 斗音 V 的萆古知斗 M / A 才. 

II 4 / U y^9 I / N w I JU^% M V I in / 矽 /MT ^^4 • 

引理 2.1 令 


▲ ‘成 


yi 


+6 x : 


1 

nj 


其中 ^ j 为最小二乘估计，则 



苴由 

，、I 



叫: V 的总离差平方和， 


( 2 . 6 ) 



Q = - 孓) 2 

1 = 1 f 


叫残差平方和， 
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叫回归平方和. 
证明 ： L 


其中交叉项 


U = V 1 ( v, — v) 2 

Z =1 

= 2 (% -50 2 

* _ 負 

I = 1 ， 

•J 

= 5] L(yi — yi ) ( y { —5>} 2 

n n 

= 、 1 ( yi- — '，• 、 2 — I — 、 1 ( \j . — 7、 2 

/ i 、… 1 / j - J ， ， 

i =1 i=l 

n 

2 > . ( V. — V：) ( Vv ~v) 

"；^ *- ^ ^ ， 

1 = 1 

t 

n 9 

2 (a—%)()«— 夕） 


1 



i = t^l 


冬 ▲ ▲ , ▲ _ 

— a — bxi){a +bxi — y ) 

- -* r 


in -, ., 

= 12Zyi —y — bixi — ^)^[_b(xi —x)J 



= 0 

故 （2. 6) 式成立. 


证毕 • 


(2.6) 式左边的 k 反映了 : yi ，： y 2 , …， 


%这 w 个值的分散程 


度 ，（2.6) 式说明心可以分成两部分 Q 和 L 7， LT 是拟合值1，/=1， 


參秦 M 1 _ _ _ • ▲ <lk ft) • ■ > •■私 «k ■■ 圓 ■ m 砉參 金 %fc i H — 詹 » rnrnmmm ■ * _■* 

， n 的分散程度，它甶回 113 线上不冋的目变量值 X , 引起，即 U 


这一部分平方和可以得到回归式的解释 . Q 是拟合残差的平方和， 


它反映了回归直线与观测数据的接近程度， Q 越小，说明回归的效 


果越好 • 因此在的这两部分中，当 Q 所占的比例相当小(相应 
地， LT 所占比例相当大）时，原来的数据中的近似的线性关系才比 




1QO 






较可信.因此我们用比值 L // Q 的大小来衡量线性相关关系的可 


^ %li - Ifc 身 - ■. 急 _ _ to i _ ^m. _ *. _ »—. 身 k - i 靜 _ . % 美 ^ _ - M - %. ._. 身 處 參 M k 、 • u • 

侰程度，这个比值越大，我们越有把捱说两变量之间确买存在线性 


相关关系. 

( 为了建立统计上的假设检验，需要先作一些数学上的假定. 

柏 / 一 一 、古一 

叹双 1» 、乂、， : y"^R I' 

y i =a J rbXi J re i (z = 1 ， 2，…， 《) (2. 7) 

_ ■ ■ • ， ♦ • •里 i vl ^ 9丄 、 ▲ 1：.：^1 it / 八 9、 / V JL ■- tTrf ^ 丄 rt ” V _ 〆 9 、 八 一 I — 

兵屮 q ，ei， …， e” 刀 3S3Z ： 网 』 V IU，(T 伟 ay _ 机父重 木 
4 nv 葙们本給胳低份 

|| 钃， I ， IL^V , 


H 0 ： b =0 (2.8) 

六 n 里不 0 下 w ofr-tK HH t=? ^ 右祕 Write 丑生玄 • 六 n*7C 台运不中 

乃口 ac. j no ^ /jyu t/ury^ ^ rj ^4 ij-'ir 赘 >h，i ’ no 口 ac. 

Ho ，说明从现有数搶出发不能认为: v 与 x 线性相关.对 H 。 的检 

I 

Ti^ nit -to JM* 4s^ nA. tr -W ? 太 r±^ o-+ ^ r^i iti -t* m / o r 、曰 s 甘 

3>tt H *1 TO jACiai m 3^ • J^o IK Tf At WJ ，仰 N l« 刀任、厶 • o j jBStSL^ 

的.令 


F 


Q / in —2) 


(2.9) 


可以证明（见 § 5)，在札下 F 服从自由度为 （1，《 —2) 的尸分布. 


取否定域 、 

W ={ F > A } 

其中 A 为 F ( l ，《—2) 分布的1 一 a 分位数，《为检验水平.实际计 

AeAr t^ rt_L ~zrt tU —iM 八 一 

昇 p 口、 j» ki 用 r 

JJ = bl xy (2. 10) 

Q=l yy —U U •丄 _U 

其中第二式由 （2. 6) 式可得，第一式是由于 

n 

u = 2 (汄 一 夕) 2 

t = i 




-X > 2 







4 ^ 
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现在回到例 2. 1 上来.用统计量 (2. 9) 进行相关性检验，计算 
得 F = 436, 査 F 分布表得自由度为 （1,22) 时 0.95 分位数为 
4. 30•而 F >4. 30,故应否定 H 。 ：6=0,即强度 y 与拉伸倍数: r 之 
间确实存在线性相关关系，回归方程 15 + 0. 859 x 可以用于 
预测、控制等目的. 

(四）相关系数 

tt~^. —r- - t - -zxxT KLr-* -A— t=t K■> -A— l=t L t it /*l\ 【，l Lrt 、人 

仕头邴 丄仆屮，安刊断艾重： y 勺父重： c 乙问的琛饪和天饪， 
人们坏蚩田 v 扫1的垤:*:相 单衮粉 


X ；(;_ 王 ）（ 乂一 夕) 



来衡量. r 是把3；和: T 看成随机变量时其相关系数的矩估计，我 
们知道两个随机变量 3 ；和： c 的相关系数 〆 : r ， 30 取值在[― 1 ， 1 ] 
内， x ，： y 独立时 〆 o :,： y ) =0,而3；与 o : 可以互相线性表示时 
[^(^^)1 =1， 1^,3；) | 的大小代表了 7和 I 的线性相关性的强 
弱.虽然这里我们把 x 作为非随机的普通变量，我们还是可以用 
估计量 r 来作为: V 与工的线性相关性的度量. 

对一元线性回归，我们还可以建立 r 与回归平方和17、残差平 

一 /^V j-» XL. fc vW 、Tf ,, X rn ， — fr、—t JLL 、人 

力邪 W 邳起、呙宏卞力邳纟 d 乙冋的天示： 



事实上， 



mvi r 2 县冋昀萆古知 r7 女 ㈡ 亩 荖萆古知/ 由上的屮你 i . r 2 絨+ 

/， ■ ，，， ■ I ~ I y—% | ' I n ^ l-j^ rflli 、 1^4 ydL. I y-4 " I n ^ yy _ |™| M V IX ^ 7 » / 、 

说明 y 与工线性相关性越强.、 


7 on 




/^与 最小二乘估计 6 还有如下关系 


b 



XX 


yy 


与 （2.9) 的 F 统计量关系为 


F 


屬 jMk 1 

T 


2 


/罅 V、// 八、 

u — r ;/ u — z ； 


故对 H 。 ：6=0的检验可通过 r 进行，但临界_仍根据上式用 F 分 
布来求. 


细心的读者可能注意到，在用统计量 F 检验假设只。：6=0时，我们用到 
了关于模型 （2. 7) 的“假 定”: 随机项 q ，&,•••,〜相互独立同分布，共同分布 


是 N (0， a 2 ) Gr 未知）.如何根据数据（: r ,，： OU = l ， …， n ) 判别这个“假定”是 
否成立呢？这又是一个检验 问题.令士 =乂 一 ； （ iF 丨，…， n ) ，这里 y { =a + 

* M 

Sxiia . b 分别是 a ,6 的最小二乘估计).这些 A 叫作残差.令 


其中 



( i = 1 ，…， w ) ， 



n n 

O = 、飞 ( — v: ) 2 • 、飞 (nr L — /r、 V 

/ J 、 J Z 如 / f ， ， ， JLJU / J ' K ” / - 

1 1 

教学卜可以证明 [15] ，如果卜冰“假定”成立 ，则 ％，•••，％近似地相互独 

^ ▼ -w - — - - ^ ~w - ^ — W W r ^ ， ~ -W , ▲ - m w r ■ w m • 

A 

* l—f 、 r* Av» t.t. n» I t 丄 — wJX. —r- —X— /V -it— I I, ■ ■ * - • AJU i . ** I. : | t I . LL 

丑，丑命 y ; 坻似玴服从怀准止怂甘仲.从冊.仕 n 0：牧入叮，％，— ，7 n 甲入灼 

有 [0. 95 w ] 个 y , 满足 I y , I <2 

反之，若根据数据计算岀乃，…， y n 后发现满足不等式 ly , l <2 的 y , 的 

个数与 [0. 95/1] 差别很大，则表明上述的“假定”不成立，即不能认为模型 

> 

(2. 7) 的随机项 q ， e 2 ，…，“是相互独立同分布的且共同分布是 N (0, a 2 ). 这 


时-统计量 F 检验 H 。 ：6=0就缺乏根据了. 

f 只要上述的“假定”未被否定，我们就认为“假定”成立.这方面的深入研 
究属残差分析的范围，参看 [15]. 


(五）预测 

有了回归直线，当自变量 : r = : r Q 时，相 应的％ 是多少？自然 



用3；。=^+^。去预测 >( 也可说用3；。作为 > 的估计).这里要注 
意的是，由于: V 。是随机变量，故；不是第二章中对参数的估计， 
而是对随机变量的估计.我们也可以构造 > 的置信区间.可以证 
明，在一定条件下（见第5节). 


: Vo ~yo 



m \ I n 人 A 丄 tin -八 -fch ^ 

/iK/yv n—L -rs i ，兴 t 



给定 a €(0， l ) .从 f 分布表中可找到临界值; l 满足 

- P (| T |< A )^ l-a 、 

于是可得、的 1 一 a 水平置信区间 

. • * 

[: y 。 ~X\^dQ /(« —2) ^y 0 +Aa/^Q/( w —2)] ' (2. 12) 

当自变量 & 在横轴上变化时，置区间的上、下限的相应变 
化形成双曲线（如图3所示）. 



图3 

例如 ， a = 0.05 时，针对表 2. 1的数据，《=24,2 = 2.074，1 
= 152. 3 



0 = 5*66, 





m 


Ivyo 


l . 052 vl 



(j：o — 5. 313) 
152.3 


• Vn 1. 


052 Vi 


- j — 


(xo 一 5. 313) 
一， 152「3 


(置信水平是 0. 95). 

(六） 控制 

如田士 S 你 … 谢去 AA. <±x.AJh ^Ur fiaT A IDl i+i, „ i-fr mr iLL y> Mr n 
MM 术 ： vs 15C ： yo 份讧菊 /twiiPsiL 八， d 」 門，工 0 皿队取 >i ^ ia : 

这就是控制问题.从 （2. 12) 知道，若要以1一《的概率保证； y 。 取 

# - I a 1 f _ t 、身 ^ _g * 、 1 1 a • ■ 知處矚纖 f ^ 

俚在 LA ， jy 」 円，则 JC Q 必观社 M 芾俩疋小寺瓦 

« 

▲ i t ' / 1 广 、)， O \ A 

an ^ ox Q — av <^ W / \n — D 
a -\- bx 0 +A * JdQ / ( n — 2) 

解土述不等式(注意 d 也是: T 。 的函数!）可以得到 xoGCC ^ Q ]. 
从图 3 看出， Q ， C 2 分别是 y = A , y = B 两条直线与双曲线的交点 
的横坐标.在有些情况下，如果 [ A , B ] 过窄，则满足上述不等式的 

Xo 小仔在 • 


(七）一元齐次线性回归 


1 在某些实际问题里，根椐事物的实际情况，在研究线性相关性 

Bfcf TTT ”,也 b “ 咎 * frTiS ” 且八 Hn r^T ^ cfeTT SiHfiT ffil 
HTJ KA R /C. 巾 从 7& vy. ^ ； J!L^ I 天生 ： 


-fcf* 山 H ir^r -Hi is?T _ r\ 

e jr,e = v . 

设有教据 （： Ci ， Vi ), … 

^ ^ W V — » ， 4 . 以 X ' r 


Y = bx J re 


(2. 13) 


,, v .) ，如何估计系教 6? 和前面 一 

^ r• r 1 | L / r ，麗， ， ~ 9 ， • w ~ v 9 ^ ~w " ^ ^ "― 1 _ ， - ww w ， 


样，应找 6 .使平方和^ —刼.) 2 达到最小值•易知，当且仅当 6 == 

• M X 

■1 

6 时这个平方和达到最小值，这里 

驚 

« 

t 

n 

h = _J _ (9 m 

or \W • 丄 】•/ 



这个 6 仍叫作 6 的最小二乘估计.于是有回归方程 



為 • - 1 - - 

y —以 


(2. 15) 


这个方程是否有意义呢？还应检验假设 Ho :6 = 0.只当这个假设 




被拓餡时古钽 d 右音 v . im 田本讲托蓣姗戒坊制 

; 一 J y^ |J- ' 一， ▲ v J 口 7 J ^ 9 / 1 ^ 4 ，■〜 14 Lr%^t J-t* • 

怎样检验尺。 ： 6==0呢？和以前•-样，应假定数据有下列 

娃紛 • 

^\ f \*V ； 

y i =bxi J te i (z = l ，•••，”）， 

I 

m _ . 一 - -ta-ir ^4t 士 r=! 八 -Ar -44* l=t 八 -frr B kt/ r\ 2 \ / 土 >¥n 、 

^l ， €£ ， ■•• ， e n TH±L<3inJLFJ7r^ 』 v 、 u，a JKO 不 T^w. 

显然，在下 Vi ， V ，，…， V „ 独立同分布，共同分布是 iV (0, 

輦 ▼ ■ » * W » V ^ w • r w W - — 


n _ 1 n 

tr 2 ) •于是了与 H (M — 刃 2 相互 独立，#〜 N (0 ， 1) ，4 2 (y 


30 2 〜 f ( n _ l ). 从而统计量 


F 


( y ) 


(2. 16) 


VCv 


y 


) 2 /( n - l ) 


腺 U 笛 1 白出曲具 l 笛？白出曲县 

▲ l-H 7 —» 卜_| M-l /^ K » > A & 


1 的 F /^jfa 限而： A ： 下 

丄 M V * XV • F^-=l l»M I- ■— A -• U I 


査 F 分布表有临界值 A 满足 jP ( F > A )= ct . 所以在 F 的值大于 A 
时拒绝此时所得到的回归方程才是有意义的. 

例 2. 2 哈勃定律是20世纪最惊人的科学发现之一，它说明 

TT* 士 故 口 t/ 々白方 -A- IU cr -U A>t 、* tte 4tb .LLr 八 T*T , -?/V 一曰 人曰 

丁田儿仕膠肌，廿生尔江以 t± 八 ffV 还戊 1^ 此 77 两.疋 -1 生 

系相对于另一任意星系的速度 d 为此二星系之间的距离，则哈勃 
定律为 


v 




Hd 


其中 h 称为哈勃常数. 


表 2. 2 列出了 11 个星团距太阳系的距离和相对速度，我们由 


n 


ill * - I — / I ^、 I M A -4*1 _-^1^二 l - T-t T T 上 L ca t __ --**■ / I . \ I r - tl-ft X . 飞 

Jfl ： 术侦 TT 咁初 芾奴 . 芴见 h 的敢小 _ 來佰 TT ， B 卩使 h 

2 = 1 

、 . w • 

达最小的 JH 值为 


T T ¥ \ 

tLdi ) 


li 


Yd 

/ A — 


>x 


0.035 44 


图 4 为 11 个点及回归线 v =0. 035 44 d . 
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50n 


40- 
5j 30- 

lf4> 

vf 

女 20- 

M 

Wl 

^ 10 - 

I 

0*^ I ^ I I 

0 500 1000 1500 

' 邊 / 管 • ^ k I • V 

(日力尤牛 J 

图 4 哈勃定律 

利用 （2. 16) 可算出统计量 F =14. 69,査 F 分布表知 F ( l ，10) 

上 L 八 八 T- /1 / 丄 . C3 A 八 八 -wrt 1 ■ A 八 /-» 丄 L r-r- >fO 上 L |—t »t — » AH C3 * • 

的 u . yD 甘 m 奴定 4. yo 规仕 t 夕 4. yb . 驭 所恃刦 的凹 w 软; 定笮葸 

义的. 


表 2.2 星团距离、速度数据 


星团名 

BBfffTT 春生、 

jh^ p^j \ i-i y^i yu - r~ / 

油由龙：田 ( T ) / M 、、 

Jb3i/-X. V 1 JC. "=" / 'L^ / 

室女座 

* 

22 

0.75 

飞 3 庙 

68 

2, 4 

英仙座 

108 

3. 2 

后发座 

137 

4.7 

大熊座一号 

255 

9.3 

狮子座 

315 

12.0 

北冕座 

390 

13.4 

双子座 

405 

14.4 


fi 8 S 

24. .S 

—警 ■»■ 

» 八 L* - 1 • 

X 熙挫一亏 

mm 

you 

Zb . U 

长蛇座 

1100 

38.0 




①英里为非法定计量单位，1英里〜1 609. 344米. 




195 


_ 







昤勃蚩粉时手 f 學宕 + 你 蓄亜坦坦彳 ff 伴的宝宙士 M 枚捆 

■ M IN JJW " J ~^f— 巧 、 | w J>^. • 11 ^- 4 /t^l I M Vi V -i M~» /、 /^s /'\ 

h b b — 里 b ^ ^ ^k ■ ■■■ —■ — ^ ^ ^h b - _ 祖 b h ^ ^h ^h 里 

论，哈勃定律是大爆炸的结果，而哈勃常数的倒数则是宇宙的年 

iMs 社奋 P ISJhh 山 Aft LJ&fi 珀 / 六且龙 * 田 /‘ 沐 • 备 1> 说 笛斗 t 备 I>_1 G 

WT* 江芯、丄 MUIR U4 口；； 口;；干 UL/t 穴 土 / 儿 丁 ' V ，仿开 /；/V /M 

■^rr rU 丄 A-rt l^r <±r J-^ A/t >tcr ifcA. 士 o o 曰 orv >tir /Ji rtA. dbi* F；Cl m A/t 4F?. 山 •1X^4 曰 
H J B 4 "^ ： W 4 沮卞田衣厶 • 厶疋厶 ^ 十 1 、喂初 /^ 1 /tJITJ 双 WJ ， mwai 寸 


到的宇宙年龄是 52 亿年左右.由于现在测量星系间距离的技术有 
了很大改进，所以用现在的数据算出的宇宙年龄约为150亿年. 

例 2.3 哺乳动物出生后开始走动的时间: r 与开始玩耍的时 

* 

间: y 是有关的，有许多学者研究过这两者的 关系. 表 2. 3列出了 
11种哺乳动物开始走动的时间与开始玩耍的时间的数据.画出 
散点图后，可以看出数据点好像落在类似的幂曲线周围. 
令 沁 =ln y ，< = In ^，对/ ，允进 行线性回归拟合得回归 

t * 

— )—rca 

刀住 

y=l. 689 + 0. 561/ (2.17) 

相当于 

v = 5. 42.r 0 - 561 (2. 18) 

(2. 17) 式对应的 F 统计量为2》. 438,在水平 0. 000 5下方程 
(2. 17) 是显 著的. 


表 2.3 哺乳动物数据 


种别 

开始走动时间 

X( 天数） 

开始玩耍时间 
- 〆 天数） 

人 

360 

90 

大猩猩 

165 

105 

猫 

21 

91 

u 丄 

家犬 

23 

26 

挪威鼠 

f ,， ^ rw ^ 

11 

14 

乌鸫 

18 

28 

混血猕猴 

18 

21 

黑猩猩 

150 

| 

105 
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* 

0 


100 200 300 

■1 竇 _ 上人 — —” j- Arrl / i * \ 

丼炻疋 屻叮岡 


400 


图 5 哺乳动物开始走动时间与开始玩耍时间 

上一节里我们已经说过，线性回归之所以重要，不仅是因为它 
数学上容易处理，实际中绎常出现，还因为实际中许多数据经过适 
当变换后可以化为用线性回归的形式.变换紅选择首先应靠有关 
专业知识，如果有关专业知识不能提供这方面的信息则可由数据 

nd A/t -nx 、 U^ 、 : 31、|z AA» XA -nV^ 4A 

取闰 trj 形认不 ta ;gs 迫曰 mi 细双々 j ; 里 trj 戈:伏 • 

一元多项式 ： y = a 。 +〜工+…总可化为多元线性回归 


续丟 


种另 IJ 

■ ■* f /. * - t ^ 

开炻走功时|印 

X( 天数） 

» ■* 獻人 ~ to* . ^ 

: y (天数） 

松鼠猴 

45 

' 68 

花鼠 

45 

75 

白脸猴 

18 

• 46 


如果直接对％和^拟合最小二乘估计得回归直线 

_ o n r» 1 I r\ r%r\ a r7 / r% i rv \ 

3 ； = C50. Ol^ru, 66^ t X K ^. 丄 yj 

它对应的 F 统计量 R 有 9. 506，#7 fc 平 0. 01 下方程 （2. 19) 不思 

， ▼ - ^ 擎 , — [ ，灣 • *<V ■ r " "W ' p V / "W • _ ■ ， 9 mm _ 

著，在水平 0.05 下显著，说明 和1 的关系用幂函数表示比用线 

杜主玄班你 U 囡5也抗以丢劲 Uf ^占 

I-!-/ 、 y^J • /y V »^a-l v ' -4 »、、 ■ 



6040200080604020 


11 1 


11 




♦ 
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* 

- aS __ = ^_ ^fr ^b ^h ^b k ^_ ■ _^ 各■泰 A ■ ^b ▲ fc ^, 

下面图 6 至图 12 是其他一些常用的函数曲线. 



n^T n *& r^ _ — A / 7 、 r\ \ 

m ( ^BHSX y^ax \o^\j) 


b>0 



S 8 指数函数 y = ae bx 


• 198 • 








^ - r 

图 12 逻辑曲线: y = j ^^(6>0) 

§3线性模 型的参 数估计 


(-) 线性模型 

多元线性回归的一般形式是 


: y = ^)+/? i^：i + … 

不失一般性，总可以设 ft =0,因为可以形式地引入自变量: r Q = l , 


从而: V = 恥 i + e . 所以在理论研究时可以假定 

2 = 0 

y =^ iX l +^ 2 X 2 ^ - ^(jpXp + e (3. 1) 

玄爷雒株冋 U=l 的由铪占 _ 7 Ptn S 1 由斫汰 . 基卖 1 1 抓垤的粉 

^ «-» I—C* 1—1 y ― I M v *-M A\N 7 JJ«* O 丄 I ty I 7 >Sk* ^V-'V — • * I I ” V >^V 


据，即 


夂11 

夂12 

• • • ^ t . 

^ip 

尤21 

• 

• 

工22 

• 

• 

… ocip yz 

參 • 

• 參 

參 

工-1 

- r » x 

• 

: T -9 

- U 

參 • 

V 

… V- 

- ft y ^ fi 


^ V 

C 3. Z ) 


其中 y 是工1 = X 2 1 jX 2 = Xu 


〜时: y 的观测值 G = l ，2, 



n ) yTl ^> p . 

我们假设上述数据适合下列模型，称为线性 模型: 
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V / I 

) 


则模型 （3. 3) 可改写为 


3^1 = 庠工 11 ^ 20Ci Z -T + R p x i p + €i 
yi = 队工 21 +啟工 22 十…+ +Q 


(3.3) 


01 工 nl + 成 ln2 + ••’ •+ 凡工⑽ +“ 

■ ■ ■ ■ ■ 


甘 r4"t ▲ 1 … 二 曰咏 +CI 且 / VrV 以 / O O \ —r+-t A/t 山 

升 T 炙 1 ^ 2 ，…，^ 疋 wai/L ：»: 里 v 边汗 vq. y\ ， : V 2 ， … ， : y” m 

看成随机变量，而 (3. 2) 中的 ^,3/2,-,^ 为它们的观测值，在不 
引起误会的情况下，在记号上不区分随机变量及其观测值）， x lV ， 

j = l ，2,…，办 ， i = l ，2 ，…， w 是已知的实数（即把，工9， …，: r A 看 

^ ▲ w ^ ， ，- ▼ ^ 严 ▼ , ▼ 泰- w w - » 

作非随机的普通变量）， ft ，爲，…， ft 是未知参数. 

对随机项 …， ^常作下列两种 假定： 


假定 A 


Ee { = 

Ee^j 

Ke\^ 


(f = l ，2, …， w ) 

㈣ ） 

( i = i ，2，，“， w ) 


其中 a 为未知正数. 


假定 B : eu 2 , …， 相互独立同分布且 G - iVCO ，/), 其中 tr 

* . 

且土细 71 ：新 

Atz 个产 H JJ- 从 • 

显然假定 B 比假定 A 强，线性模型研究只要不涉及假设检验 

/^t^r ivn jto rt m 加 加占 a 

TM 且 I 曰 ai 口 J — 7®C7NrP^U IR/t 

为了表达简捷并便于使用线性代数的知识，我们大量使用矩 

-Tit 曰 - 、—* 口 、―I 

件邳 I 円里 1C5. K ： 



Y= 


yi 


# 


， X = Cxa ) n xp 9e 


# 
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Y = XR -\-^ (3.4) 

— 一 -V 一 » —， 

/ 

W 丨 # 奢 1 W ■ & 、 t * • 塵 ♦ fc^_#__ W ft • #1 ■ i ^ _. t ^奢 .产 - 

具甲 e 为 n 维随机冋量， A 为 ^ X /> 常数阵，/?为/>维禾知蔘数冋 

县 A TiT 志;士斗 

^El • | 认 ，& 2 丄 ^4 

Ee = 0 9 Cov ( Y 9 Y )= a 2 I 


-fcrf* 1 -l-r r Jtl^ M /4 - fT/r _ ， ▲ 、 士 ♦ I— AA# X4« r^ tr^T Ita ID TTT 士 

升 t 乂力平 mR^iovvir ， y 衣 /j 、 i ； ^ rj tnj w 刀左吁 . ik 疋公 w 』衣 

示为 # 

▼ ^ -W 


e 〜 N ( 


，0 
0 


參 

寒 

# 


0 


9 ff 2 I ) 

t 


或 


Y 〜 N ( X /3， C 7 2 D 

以下筇们沭田$||>此线杜伴粉由的 ip 县 1^ n J ? k 由的向 

I -4^4. II 4 AO* / 1^ - ^>-Si I—L^ I V I M v rua v • K^s. ^ V * ' I »-• V I ^ 


量， M 为 V 的子空间，则记 I | fl || 为 a 的长度，记 Proji 为向量 a 在 

M 

子空间 M 中的投影 向量. 设 A 为一 mXA 矩阵，则 〆 A ) 表示由 A 


iib h y^^ilSI^ pXtAh n m 6ft 工六向 rfn 县乃 TFT I 、/ 古 TC 赤乂 V 細 

^ I /y v^v/4AiM^ mv j jz i m j jm. ^ ^4 yys t~t -Lu^^yj /ur 

a = Proj a + (a — Proj a ) 

M ' iVf _ 

其中 （a — Proj a ) 1 M . 

M 


(二）线性犋型梦数的鼉小二乘估计 


TC 而 : Kff 必祕 Mr 进荆 A 、 出会粉 /3 的 /fdb 々 +ivn 麻右了一胁细 

I m n/\ I 丄 , 的 ： =ii \ ^* 】/ | ，夕 ： 55 人 /j IM ^ I I^J n 4 r4A.<=tl 

论，不仅可以用于回归分析,还可以用于方差分析、试验设计、数据 

t 

\ir 姐始 =CA* Mt ^_L 匕时 

丁泪守夕 rr 巩 H \^im. 


已知矩阵 X 及观涮向量 Y , 如何估计 （3. 4) 中的妒应该选沒 

- ^ r ■ 9 • T-— ^ ^ *■，-，- • ▼ • v V ▼ ■ 、 ~ w w " ~^w J _ ■ r r J 

/-4^ >?ci / A J v - t - 1L LL 少 *~t « •• -^rt » * * - —* ■ • • 曾 _* J #. bJUk 彦丨 、 _ - *» • -* - X.K 

便侍 4) 〒的 e” 很小 "• 支到上一节一 兀凹妇 的汩反 ，一 柙目然 


的想法是使 


n 

Qip) = 2] {y — (A 々 1+A 々 2 H - V^pX ip )} 2 

2=1 

= lY - X ^ H 2 
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(3.5) 



饮剌傷 A 

蠡 ■ _ _ k a fei » » 詹麄 ▲ ^ ^ ▲ _>^ • ft _ ■ • * ^ 丨丨 、 ■ t ■里 

足义 3.1 对线性模型 （3. 4) ，称#是^的最小二乘估订，卯朱 

— .+T1 D 古 
/vj w fj，’n 

Q ( j 3)> Q 0) 

tT tkt A At rm _5 人 Vix - 7 ^ BL # k — k Sfif i-m L AAt -fe -A- iL4 - TX -f^-rfir >K 

I ： ihj trj 疋牲化边 j 取 ， j 、 一木 ia h 口、 j^rria ： 1 土从升小瓜 • 

定理 3.1 (1) 最小二乘估计 一 ^定存在. 

(2) 卢是最小二乘估计的充要条件是0适合方％(称为模型 

( 7 , 4、的 TF 挪古 坦、 

XV* ▲/ l-v V ■ I * / >OJ r l"i - ， 


令 


X f Xp = X f Y (3.6) 

证明：（1)注意到X的各列张成的线性 空间/ /(X)可表示为 

jfi(X) = { r ]^： R n : 7? = R p ) 

f f r ■ ■ 


则由投影变换的性质知 


P=Proi Y 

， 一 _ _j 一 

/ AX ) 


||y-e||<||y-x^|| , v/?e^ 

而 ^G/^(X ) ，从而必存在使，即 

||y-x i 8 ||<||y-x/ 3 ||, 

即 

0( a )<0(3), \/ 8 GR P 

因此 $ 就是 13 的最小二乘估计. 

(2) 仍记 f=Proj Y, 则若；^=芒,当然有 

fi(X) 

. \/^Rp 

' 卜， X 广 X 7 ▼ 卜 - » 

反过来，若0使 (3. 7) 成立，注意到 

y =^+( y - e ) 



y — xp= (尽一 xp) + (y— 
1卜蝴1 2 =||¥—6|1 2 +||$—靖 2 

甚： sr /5^= A 削 All 2 •而 妇门 7) 茅居•故必右 

I ••卜 、、 /w ' 广 r ,， || — 、ji yn 、卜 '•—, j v ^ v • ， ，，— ^ I ^ 

X ^= e . 因此 (3. 7) 成立的充要条件是 
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V^=fi=Prr^i V 

up ^ ^ v-rj ^ 

^( X ) 

即碎丄 〆 ； Q ， 即 Y —碎垂直于 X 的每一列，这可表为 

■ 亡、 a. 

A cr — A^；=U 

刖 d fi ) 孟成古 彳 if 也 

-■ ' — ’ — x x 厂 wj - r** - | • 


% 驗 ▲ h k. * M • - . w 遽 - - A 詹 土 ft %. _ __* - - * W Ai 酵 fc ^ • I * - A - M M _ 

汪获们叫以小用线性空间的孜影理论，亘接利用矩阵的基本运算绐出 
本定理的初等证明. t 


设卢 = (/?i ，… ，心）/，从 (3. 5) 知 


0(B) = (Y—XB) / (Y—XR) = (Y—XR-hX(R — R)) / (Y—XR-hX(R — R)) 

— - j ， - -及 —■ ^ ， — — j — ， ' — — — — — ^ ^ ， 

= ( Y - X i 9) , ( y - X i 9) + (X(J- i 9)) / X(J- i 9) + 2( X ( g - i 9)) , ( y - X i 9) 

= Q 0 )+\\ X ^- fi ) || 2 -2(^-^) , ( X / X j 9- X / Y ). (3.8) 

i f 

由此可见，若及满足方程（3、6)，则 Q {^)> QQ ) ，即 及是卢 的最小二乘 
估计. > 


郑们推.屮古斑门 D — 空右彼企院卜_找处古班铂<^ fi ^2 e * tr 4 GBfe Y f Y 

^4 II j j 口 *-m xv 、 w v , n /irr • n —u- t ，八 i 丄 /v "i-x ： —ll \ … ^ x m v ， j 、 r - r ▲ 及 ▲ ▲ 

与 A 有相冋的秩 ，而增 厂矩阵 （ XX ， XY ) = X ( X ，： n 的秩不超过 A ： 的秩，所以 


增广矩阵与系数矩阵有相等的秩.依线性方程的解的存在定理，知方程 （3. 6) 

•■ - , -- ,» ■»■ ▼ ^ ^ '■- ■ » * ’-» ’ •■• ▼ v- ^ - , ^ •■ - ， ^ * ^ ▼ ■ ■ ■ * •- e w ，- • |p w 9 ^ ■ - ， ▼ ■ ■ 


一定有解.这就证明了最小二乘估计一定存在.设 g 是方程 （3. 6) 的任何一个 
解4 是沒 的任何最小二乘估计，从 （3.8) 知 Q(^)=Q(g)+|| X(3-^) I ! 2 由于 
Q 0)< Q (3)， 故 X (3 -在) = 0,即 Xp = 邓，} X f X ^= XX ^ = X ' Y . 这 表明卢 
一定满足方程 (3. 6). 这就完成了定理 3. 1的初等 证明. 


顺便指出，本章定理的证明中凡是用到线性空间的投影理论的都可利用 

% 

i fcj • * - 、 i-^ 鳜 * •- t t # # . I ㈣ v A i . ▲ H 1.^ p i 廬 .. .• a *- # •、 

矩件知识避兜 K 枚捆冢 的仅影埋论.当然厂 扠影埋 圯" 也有兵优 A : 俚卞从儿 

何上把握研究对象，表达简洁，且便于推广到无穷维空间（时间库列的研究就 


涉及无穷维线性空间）. 

以下恒用0 表示# 的最小二乘估计.易见 

Q (^)= y , y - y , x /? (?.9) 

爭买上，因1^=入/?十(^—;^),所以 

Q(i3) = ||y-x/3|| 2 = ||y|| 2 -||x^|| 2 

_ 'r 擎 tt**A 

=i x —/5 a 八 g 

= Y f Y - YX ^ 

最小二乘估计可能不唯一.不过下面的推论中的条件在大多 


数情况下畢满足的 
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玄 1 1 芸 Y 維班（刖 Y 的砗笔平 IDII 晶爪一垂壮朴胜 

¥， * 0—1 ▲烏 in r iyv 、•"厂 ▲暴 M v 'IXV ^ -4 ir ^ 7 /、■* -*t^. r -4 - - /_、 I |-l r I r H- 

一且 

^CX'X^X'Y (3.10) 

Q 0 )=Y a-xax'x > ~ 1 x r )y (3.11) 

这是因为 X 满秩则 x’x 满秩（实际是正定的），因此正规方 
程有唯一解 （3. 10). 式 （3. U ) 只要把 （3. 10) 代入 （3. 9) 即可 
导出. 

^ 沣音现#我们坏沿右用 © I 假宙 A 或低宙 B . 我们 R 知谐一宙 

可以求出最小二乘估计，但不知其优良性如何..下面的定理为了 
讨论估计的性质就使用了对随机项 e 的假定 A . 

定理 3.2 对线性模型 (3. 4)，设 X 满秩，且假定 A 成立，则 
对 的最小二乘估计^有下列 结论： 

(1) EP =^ 

w w 

(2) Cov 0^)= oHX f X )- 1 

(3) EQCp) =-U-p)a 2 

、 ― r* rirt 文 「 ✓ *» y/ ，广 、— 1 又 t, ， r~~~\ 产 'w ^-w r 、 —>- 1 T T, t 

〆 lit 明：匕戸 = iS[_AA A 厂 ‘ A 1 」= A J *A t,I 

= (x ， xr l x ， x" 

(JovW’psCovCdX) -1 ^ (A)S+d ，（ X ； n'A CA# 十 e)) 

1 = Cov (( X , X )-" 1 X , 6,( X / X )~ 1 X ^) 

= (X，X )" 1 X / Cov ( e , e ) X ( X，X) rl 
^a 2 CX f X)~ l 、 

记 A = I — X ( X ’ X ) 一 1 X ’， 由 （3.10) 知 

/ A\ A xr\ /'r- K Tr\ 

/ii > = isrn,x /ii ; 

= Etr(AYY) 

/ A V — / ^ P « ， f 、、 

= trCA • iicrr ;; 

而 

E ( yy r )= Cov ( Y , Y ) J rX^X f 

= a z l^rX^X ， 

又 
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所以 


AX=(J-XCX / X)' 1 X / )X=0 


EQQ) = a 2 tr( A) 

0 

_ 9 ( . ✓ t 、 n 'xr / 'r, 广、一 1 'xrf ~I 'I 

=<T uruj — trLAiA av ‘ a 」/ 1 

j =^{n — \ rY ( Y ' Y^~ l x f xi \ 

、，■^ \ •息 a a y •息 •雄 j 

> 

=a 2 (n — p) 证毕. 

Q nn-Ar^E«ii A cfriV V» V 播 ift66 欠处 T ： 县 /I 、一趣 /fdb 

山。 y^UmiP^^VL/^ 八肌 - 从八 ■ w MV 不 IT I ， **t)d — IM 

计卢是参数 i ? 的无偏估计，而 

« 琴 

.'d I 森 

^ 2 ~ Q ^ 


是^的无偏估计. 


若 x 不满秩，则^未必有无偏估计，请看下例. 


例 3.1 设有两个物体分别重未知，把它们一起 
放在天平的一端称 n 次 ，第〗 次结果为:^这时任何一个稍具常 

> 1-1 JLf-m I -y.tt I.V. -tJLt. —r^ ■ I j ■■ * 人 iUL^ /<X*> it# Jmt* —g. *=» I I 你 / ■> rtlil _ Irr -rfr 

八邵沖迫达仟孙个 m 网 x 糊件脅日 m » 里里.久双' 子肌 m 木 


看，我们设 


yi —/9i +^2 (i*=l ， 2, … ， w) 

其中 ei<,e Z y *•*»«„ 独立同 N (0， tr 2 ) 分布， a 未知.这里矩阵 X 为 
/ zX 2 阵，两列的元素都是1,故不满秩.凭直观我们知道 ft 和 ft 

-tts. r^r ^rt -fc* _=n /th I-U ) 丄 T»-X .U > 、卞 Trr \I1? -Mr )TT- tl 口 m cr )TT* ^4* -An S r\ 

月疋汉书儿獨 ItjTT ，人 J ULMi M J 厂價此明 . /« 仪 Tin 広， JXU 木 /Ji 匀儿 

偏估计 <p(yi yy 2 ,*•• f y„) ,JP 

、 ^<p(y\ ， : )^2 ， … ， Jn) = /?l 

而 > 


E < p{yi 9 y z ? ••• jy n ) = E < p ( j]i +^ 2 + ，…， pi +^2 + 心） 

•+oo 冷 +oo n 

= … < p(ui , f u n )(2 mj 2 )~^ e ~2? S \ iUi ^ 1 ^ 2> dwi … dw ” 

J — CO J — oo 

—作 f r% 上 0 、 一 n f \J n n \ 

~ T P 2 ^ — pi V V pi ， p 2 V 

这是不可能的，因 ^(0) =^(0 + 0) =0 = ^(1 —1) = 1 不可能成立 • 
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mvl ^ 太友龙干偏壮朴.固理化也沿右子偏壮朴 

// I ，/、 114 1 -^ ^ <-* KI'M 11-1 ^ | 7 |- v ^― t- C^- 14 w KI>M IH ^ I • 


备 — _ _ U _ a - M A k v k. ^ i ▲ 血 k 遽 ▲ _ _ M ft 砉 ^ ‘ m * ▲ ▲ 

例 3.2 表 3. 1 是杲个化学试验中，每隔 5 分钾对温度进行 

一咖邻 iii 县的米 frie ^ 4nmj^^m ^ ma^cm7t^ 41^ 6bm m 斗 t 了热作 

vvtK-j 3^. v4 jy^K vm ? 4^ ii j -5^ wi yuvuL r*a h*j i»-j ru mv /vu w"* j i»j ru 

计算，定义 


ii — 30 

x -- 

1 5 

yi = (Ti — 99. 0) • 10 

容易看出，数据&与:^ .的关系不是线性的，我们来作二次曲线拟 
合.设 

* • a ■ 

3^,=<2 十 6 :c, •十 cxf +e £ 


表 3. 1 试验温 度数据 


时间 〆 分） 

X 

温度 nx ：) 

y 

^2 

X 

^4 

X 

5 

— 5 

/\ /% n 

yy •乙 

n 

L 

nr 
乙 D 

rt r 

060 

10 

-4 

99.7 

7 

16 

256 

15 

__ 3 

r\ r\ r\ 

yy. y 

r\ 

y 

r\ 

y 

r% -i 

01 

20 

一 2 

100 . 2 

12 

4 

16 

n r 

60 

一 1 

1 /\ /\ o 
丄 UV7. 0 

-i o 
丄 o 

i 

1 

1 

30 

mm 

100.4 

14 




1 

100. 4 

14. 

l 

1 

40 

2 

100. 3 

13 

4 

16 

45 

3 

100 , 0 

10 

9 

81 

50 

4 

99.8 

8 

16 

256 

55 

5 

99.4 

4 

25 

625 

〆 


由 TF 规古耜的一船形式 X f XR = X f Ymm b ^ t ^ la . b . c 的畺/ I 、二 

r _， ■ ■ * /，^，寸 ■ ■ * r^m ▼ / y 、 — —— —— ▼ ■ _， ■ * r ^ W-W ▼ f - f - W-W ▼ ■ - 

_ #t 乂 》 丨 # * I \ , • 、鹹 

來恬计的止观万桎为 

m . = nn -4-A "r. ~4-r 

|f I ， I I I w j 

' 2x ， 3/ £ = a2xj J rb'EiX z i +c2x ； 

V ^? A1 V 1 ^.2 _|_ A V ^.3 4_ ^ V ^.4 

j £ L4^ £ I /- ^ £ I 。 I 


经过计算得到 
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10 fi = 11/7 -Minr 

'V' I 

20 = 1106 

fiR8 = 1 1A/7-M QF^Rr 

v w w -a . 丄 vf'w^* I 丄 w* 

解出 a , b , c 得: y 对 x 的二次曲线回归式 

C , = 1 ^ Q 79 1 4-0 1只1 «T —n fi ^ r 2 

V 丄 I 、/•丄 y 丄 vy «ji^ 、/ • x 、/、/ vr%^ 

可算出残差平方和 

Q = || y — X ^|| 2 — Ey ? — 

=1 18&—13. 972 1 X 106-0. 181 8 X 20+0.433 6 X 688 


1. 638 2 


随机项方差估计 


ex 2 = Q / X 11 —3) — 0. 204 8 


又可算出 


cx f xr l = 


0. 207 5 

0 




V 


r\ r\ 
U. KJ 


■ ■ 

11 UU 


Q 

0.009 091 

Q 


— n nil aa ^ 

V/* V/ X 丄 \J \J 

0 

r\ r\r\ 1 1 a a 

U 9 丄丄 OO 


所以 Vara , Var 6 ,Varc 的估计分别为 0.004 25,0.001 862,0.000 238 8. 

+m Tftt — : Xn … m 店 士 A/t n-l* iVH 上 Xn 泊 cte T / 上杜 彳曰 OL nA. 八 -rl^ 

JG 义里 工 TH ：y nj /^、 不 trjp、j |oj 【 TH 恤戊 1 1 、甘， 1 守纪 独7^工、 

T =98. 727+0. 107 7卜0. 001 73 At 2 
为了找出最高温度出现的时间，解方程 


▲ 

dT 


r\ n n r\ r\ r\ r\ a C\ . __ r\ 

U . 1U / l — U . UU 6 4 D 0 r = U 


八 ✓%// 、 、 ㈣ 磬 - g ^1* i ■ 

侍 t = 6 L , UtK 甘）呵湿皮敢咼. 

(三） 线性可估性 

A ▲ • - ^ 人 1 J vrft 声 ' —H # t 、丨 # - ■■•■■* - ^ - *2* ## # 會 ，1 』 弟 \tAt ^ / •、 

早个执 口 j 能汉有尤偏恬 tr ， 现在饼艽 p 的统彺凼奴 gcp=c 
钮射 右子偏壮社坦 

I ^ ^l>M IH ^ I 7 JZS=^ 


C = {C\ Ci * m *c p ) 


为数值向量. 


定义 3. 2 称 c 卞 是（线性）可估的，若存在 Y 的线性函数 


n 


aY = 使榑 
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Ea’Y=c’p (V ^R p ) 


如果 X 满秩，则 VcGP 有 

i 

Ec^ = E{[c ， (X , X)- 1 X , ]Y}=c> 

即这时4必可估， 〆 s / wxn ' 下面的定理讨论了一般情 

I 

况下的可估性. 

定理 3. 3对线性模型 （3. 4)，设假定 A 成立，为了 可估， 

~ … 、 r ' < _ ^ 1 § --- 

必须且只须 〆 是 X 的行的线性组合，即 c 6 〆 ，). 

证明， 充分件 . 设 (/ 尺 ” ），咖 /a = am 而 

^ ^ — , , /、，^ j'—■ ，» - ,， 

、 EaY = aEY = aXp = cp ( V ^6^> 

因此 可估. • 

必要性.设可估，则 存在 〆 使 

EaY=c^ (V^e^) 


即 


从而 


a f X@ = c,g ， V R p 

( aX - c ^^ O , y & R P 

aX=^c 


an / M 上 i-z—* jh /*l\ t.*i - am 人 

即 c 定 a mn 了的软征组甘 


、- uu 

nt 平. 


如果可估，则它的无偏估计可以通过 0 的最小二乘估计 

i - M ^ ^ V t t ^ v • • _ 

(一足仔在）米构逭. 欠 


* 1 7 +祕处谐刑 a a t # 

r^m W ， 1 \ |HJ /y\ — V ， '「I /、 ' ， V J -o\t I-I- vz^ -=±^ \ w • 1X7 /M— i 今 A£A4 

立， 3 是 0 的最小二乘估计，那么如果线性可估，必为 〆 /? 的 

他一 66县/ I 、七老祕純车伯处斗 

r P^ ，刀：匿工 /u wnj iR • 

证明 ：设 〆 Y 是 〆 0的一个无偏估计.令 

膠 

_ * _ T">— ^ ^ _ _ * 

a — jrroj a 9 a —— a _ a 

/i(X) 

mil ^ I Bn v 

yv4 ^ I £x\^^ / ， i^r …’ 

aX = 0 


由 


aY = (a # YY + aY 
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而沩取助齒 m 


l 


c f p = E [( a # ) / YJ + a / X i 3 

— r 厂 r \Wi 

— J^\_\U y 丄」 


即 （ a # ) Y 也是的无偏估计.下面证明它是的唯一的最小 

， # ^ , - - - — ， — | - ，-- 

—>-* -XZ* AJ\ Lji. -K— /r** / t, 、 I 

刀左玦饪兀谓怕 rr . 


份 h ， Y 七 r ， R 的佯一千偏壮朴 . u 而口里全 

v 墨 广 〆” V ■■■— /w KI>M _H r ■ 7 // v " ■續 x 、 一 ^N 、 

y =Proj b , b = b-y 

fiiX \ 

i 會 >.VA ， _ ft v » f_-_ - 、《 AZ* /， u 、 f ， ▼ . t f • f ， w ■ > t ^ \ I t ■ t ^ - 

杌冋砰地円以知追 r 也是 c p 的尤偏怙 tr . 田此句 

I 

n =厂厂广乃* ^ r v — ( h * ^Vl 

V A-^ |_ / A 1 J 


t:n t w 

m kA 


= ( a * -y yxp (ypeRn 

( a * —6* ),X = 0 


汪葸到 a -—6’ e ； KA ), 故 a * =6*. 于是 

Var (6 ， Y ) = 6’ Cov ( Y ， Y )6 

= b f (a 2 1)b = cr 2 1| 61| 2 

? ✓ II F * II 9 I II 9" II 9 、 

r 十 ipip 

= 川"叫1 2 本 iaiim 

^ x m w a _ I v _n ' 

> a 2 \\ a * i 2 = Var (( a * )， Y ) 

日 n / A * 日且山 一 b* 必 J/H / 白 /4* 2 丄 -An ra ^ /|'-| 上止 // V J^t 

va / 1 疋取 /J"J 左狄 I 土儿谓'|口 H • 沖不风 IIJJO ： — 少 bC u 1 Ui 

是最尔方差的，即 

Var (6 / Y ) = Var (( a # ) / Y ) 


J /M—■ 口 

|| 6|| 2 = 0 , 6 = 0 

an 

b = b * = a*j b f Y = ( a * ) f Y 


PU * )， Y 是 c ，/3 的唯一的最小方差线性无偏估计. 

最后来证( 〆 )' Y = c $， 这里戶是尽 的任一个最小二乘估计. 
由定理 3. 1的证明过程可以看出 
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荩= Xj 3 = Proj Y 

/i(X) 

因〆€户(；0，而7—$丄户(；0，所以 

. .. 、 / 一 爹 * ， ▲ 、 _ 

(a* ) (y-A/?；-0 

( n * Vv =( n * VYR * 

\ 〜 ， ▲ V ^ / ▲▲户 

又由 

cR=-E(a* VY=(a* VXR. ^ R^R p 

I — J ■ ' _ - ， 、-- ， J ■ W ， J ■ 

知 

(a # YX = c 

所以 

( a * yY =( a * yX ^ = cp 

证毕. 

注我们也可不用线性空间的投影理论，直接利用矩阵的基本运算给出 
定理 3. 4的证明. 

设县//?的仵 i 无偏估 i +.0 tl £：(^7)=//?.刖有，^又/? = //^欲对一 

- — > __ — ^ ^ I • • ， w w | • 9 ,〆 ，1 、 — ， ~ 矿 ― ，- _ _， — 一 ^ ~ ^ , ■ *# 

切芦成立，故 : 

§ _ / 

. a r X=c 

根据线性方程组的解的存在定理，有 f 满足 XW (因为增广矩 

咗的雜笺干玄救柘咗的辑 o .合 

I I V IX V ^ ^ I V V IX V ^ J ^ 

a* =Xf 

则 X ， a* = ； ^ ，从而 (^* ) ，（ a-a*) = (JT ) / X / (a~a # ) = 0 •从 a = 〆 + 
(a — a* ) 知 

I a || 2 = || a* || 2 + I a —a * || 2 +2(a*)'(a — a*) 

= II， ||2 丰 ||2 

"一 II ■ M 认认 II ， 

我们指出（， ）'Y 也是的无偏估计，而且对于^的任一最小二乘估计 
5均有 •实际上，£：(〆 ) / Y=(a* yXB =( B * yX ' XQ =( X f XB * Yb 

j ▼… I — - if I || 

= { X ， ayp=aXp = cpAa * YY =( X ^ )， Y =(『 yX f Y ={^ )’X’Xg (因为 g 

满足正规方程 （3.6)), 故 （a* ) / Y=(a* YX 卜 c / X 卜 c % 

% 

另一方面， 

VarCa'Y) = a Cow ( Y 9 Y ) a = a 2 ||a|| 2 = a 2 (||a* || 2 + ||a~a* || 2 ) > 

n 2 \\ a * II 2 = Var((a* Vy) = Var(r’/§)- 

■ ■言 — ' -— ' 、 ~r — r -—■ — — 、 ■—■ r 

.11 ■■- AeAt- 1—1 ^ 上 1* -J— id? A* tml^ M m. - t . .1 / 二 B / « 上 1_ 上 1_ M I 

此式屮寺亏肷 IBV 尤安汆忏定 a = a" . 田 W： 沖 c 卩定 c [ j 的唯一的 琅小 

方差线性无偏估计. - 
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定义 3.3 若3是0 的最小二乘估计，则称 cm 的最小 


二乘估计. . ^ 

-fcn B9 Ja 7Tt>#4 - 并口公 fc A4* 进拍 I / 。 A \ Miim U cfr-rV Hilt 

UL. 不 t p m j I 口， : 7T_tLA，J ^Xi KXT3^iH V 。 . 吁 / 口 y ItX/t ^ 队儿 ， WJ 

可以证明，是所有 〆及的无偏估计（不限于线性的）中方差最 

9 W • - - 

A I w 上 At 

/J、tM 

下而的宙理柄穿理} 2’的笛二备结讼椎广菊 IT X 不滿秩的 

W W V W-^ ▼ ，- ■ 矗 ▲ ^ / ■ * - — ▼ - - w^9 ▼ ， | ▼ ■ _，，， ^ W • ， ■ ■ / ^ ^ _ — ■ • 丨 -， ， r » ▼ 


情况. 


定理 3. S 对线性模型 （3. 4)，设假定 A 成立，矩阵X的秩为 


，则 


J2_ Q 0) 


是 tr 2 的无偏估计. 


_+2 


证明 ：设色 ，各， … ， & 是 〆; o 的一组标准正衮基 ，舔加 :& +1 
，…，&使之成为只”的标准正交基.记 

% =(色，尽2,…， &) 

； ，‘ ' 

_ 

y T 2 = ($ r+l ，芒 r +2 ，… ，每 nX 


V =( V l 9 V 2 ) 


A. 

令 L 



则 


ez=v ’ x O 



_ / ^7 ^ y \ 2tz^t r \ 

kjv 、 Z/ ， 厶 j 一 a v v —a 


又 Y 可用 2 表示，得 


之 2 


VZ = (& ^ ••' ，&) 


I 〜 


n 


2 d 


从而 
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d . 


Q 華 轚畤 _ 

^= Projy => 

㈣ TTT 1 


n 


_ X! 飞 、• 

K 一 ~ 2 J 啐 

U i=VH-l 

m 0 * « 


4 

• 乂 


所以 


or/$i = : v —^ l 2 = 

\ 卜， ▲ s / j ~t 


H-i 


n 


KO ( R ) = V & 卜 

- ' 广， X A 1 


i ^ H-l 




§ • 

2[ VarU ) + (£^) 2 ] 


i == r-fl 

^ in — r ) 

\ ， ■ r 


毕 • 


如果假定 B 成立，可以进一步证明 P 是 tr 2 的最小方差无偏 


估计. 


(四） 带约束的线性模型的参数估计 

在前面的讨论中我们对线性模型 （3. 4) 中的_数0未作任何 
限制，因而对最小二乘估计的取值也没有限制.在有些问题里 ，参 


数沒 满足一些给定的条件，要求估计量也满足同样的条件，现在就 
来研究这个问题. " 

& 3 . 3 ( 平滑问题）在天文测量中对空间中3个点构成的三 
角形 ABC 的3个内角 d ' H 迸行测量，得到的观测值分别是 


由于测量是有误差的，所以就要找出 m 的估计 

* 

值.当然 M ，％，％ 分别是久，此，氏的估计，但由于仏+久+仏= 

zxz ： I I -Z-* r^T Jd- %zn IV r .V TWf 4Ji XrT AA j 丄月 n n 

丌 ， iiij ：yi T ： y 2 丁： y 3 个一疋 ， j 弘、安： pc 叉对 trjifjTT a ， t7 2 ，％ 

使 d \ ~\~8 z -\~6 z = 7T. 设 

' i 

t _ 

* I 

yi = 6 \^~^i 

r i 
* 1 

yi = Qi ^ r^i 


^ y% —Qz +^3 
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祖巷.弗们假空舰鲁子玄络伯巷日么外刪鲁和百她办 . 

^ Q 7^0 X V C^N.yOL* 7 ^\i II g 11^ I^VI /UA ， g 、 -5/U Klig >CXi -j—i- I—I ■/、±±±^ % Kl —■— 7 


慶 j ^• _ ■ _ 身 * . ■ 身 - V m - ■ 身一 • _ ▲ 

谷仄测 量的精度相等，于是 

T^/?. = n. t^i ?/7 

{ vr y {^ 




这是一个线性模型，问题是如何找到满足条件 A +A + 良 

y I 



的估 


我们先讲一般理论，然后回到这个例子. 
对线性模型 （3. 4)，设参数^满足约束 


HB — r 0 (3. 12) 

■ 

这里 H 是给定的 s X /?矩阵， r 。 为已知向量，且恒假定方程 （3. 12) 


有解.如果要求/?的任何估计6也满足 


Hb = r 0 

那么这样的估计问题就称为参数带(线性）约束的估计问题. 


瘇％ 翕 ^ m \ 

疋乂尔4 忙 


®o = { j 9： H ^= r 0 } 


(3. 13) 


11 . # r v t r—* - 、"- »—• 

右怊 tT 重 p 满足 


n 、 


# 


_ ii — _ 為 ii 

(2) \\ Y ~ XI 3 \\ 


min || Y - X 5|| 

^ e 0 


则称#是 0 的带约束条件 （3., 12) 的最小二乘估计，简称约束最小 
二乘估计，也记0为 

约束最小二乘估计永远存在.有两种方法可以求约束最小二 

# 

vf- 4 * )丄 

IP H • 

( l ) 消去多余参数法 

_ 

: S^L -U 人 今 - > 0 -上八 m 4*0 1=1 I I / o in 、 ^ 4 -^ 11 > 人 今 / 口 rt 4 *m 

仴衣岁求麥似拔 tni ； &您定 执、么丄脚 m 步求麥知 ( AKH ： fG 匕 

们用无约亩的叁数砉示出夹）代人 （3. 4) 中用一般悬小二乘法讲行 

,,，, ■ ▼ ^ , ▼，- - in — ， _ W" ■ ■ 广 • — ， P ^ , ▼ 、 _ - —— r , y ■ ▼ / ^ ▼ — 广 _ _ w _ • w -w 

/4 - 、 ■ 

陌 TT . 


不:半一船杜 . 葙们 假份祐 咗只的 9 托县钱株千笨的（汶桂仿 

■ /、 /^*^v i —7 ii ^ il^ zn— I I * — v v I yvw - p >^v 4 I I /-^j^ 

有 s < P ， 否则参数可直接由 （3. 12) 解出）且头 s 列也是线性无关 

■ 

的 iP 

M V * M-a 


參 
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H =( H 1 , H 2 ) 



其中 Hi 为 H 的前 S 列•记 


%>)，，> 


A 

,0 


# 


I r% 

IPs 


i 


j 


® 0。，则 


分 1 ) = R ,— 1 A — Rr 1 VI, ^ 

户 ^ ^ 1 # U ^ ^ 1 ▲ ▲ 6 卜 


这样模型 （3. 4) 化为 


Y=X 


nr v 0 

o ' 


、 


+ 


- HT l H 2 


,( 2 ) 


~he 


令 


f 




Y = Y-X 


HrVnl 

A V 




0 


x=x 


一 LJ -1 


HVH Z 


\ 


则 • ：： 

Y ^ X^ 2) -\-e 

现在 〆 2) 的取值已无约束，可由正规方程 

X f X ^^ X f Y 

你山 rH 2 ) A / t 姐山一 从）丄六 （2) 人 

wcq p wjm^v —— 巧 e ia h p r 


»( 1 ) 


HrVo - Hr 1 ^^ 2 


A 


Am 


i(2) 


it LK 亡 、JXh , , 一 ，•麄 m—» » 

I 然 p 满疋约來汆忏， _a 田 

IIV — Yy ? ll 2 -： 

11 ▲ “尸 11 

易见 ^ 确是约束最小二乘估计. 


Y — YP (2 > 

辛 ▲ ▲ M 


站土金么矣新吐66她占且苗步治拓胞右 RrfW / 访由柿 
in ^ ^ 7^s 人 ia w 。 u^/^ ， c ： »r<j 、 jizL/^rr ， h j v-u-tx.• 

(2) 拉格朗日乘子法 
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约束最小二乘估计还可以用分析学中求条件极值的拉格朗日 


乘子法来求.我们用代数方法给出下列定理. 

由 IS 1 5 且处 进 Wl/O A\ 6h^J>h-F*T Q 19、 66 

v yv j p 疋认 ui^^yo. oy rp 夕 ： j 不不 rr vu* 丄 uv 

最小二乘估计，必须且只须存 S A 满足 

w 


i T 

I A j\p — n a— j\ i 

I H 8 =rn 

■ - w 


(3. H ) 


证 明：充 分性.设有 A 使 (3. U > 成立#为任意的满足 Hp = r 0 

的 向暑咖 

r-i v I ^ w ^ 


|| y - x /?|| 2 =|| ( y - x ^)+ x (/3-^) J 2 广:卜 

、. Hy — 邛 || 2 + « x 0 二炉 I 2 

i \-2( Y - XpyX 0-^^ 

注意到0和 P 都满足约束条件从而 //($ —的 =0,又利用 （3. 14) 
可得 ，、 

( Y-Xpyx 0—^ = ( X r y - x f xp ) r 0 — j 3 ) 

• . 

t.t . ^ 

既 


|| y - x ^|| 2 =|| y - x ^|| 2 + || x (^-^ 

> lY -0 r ： 


即 g 是 p 的约束最小二乘估计. 



必要性.设0是满足约束条件 （3. 12) 的^的最小二乘估计， 
当然 （3. 14) 的第二个方程满足./下面证明必有 A 使得0满足 


(3. 14) 的第一个方程. 

?rL t t=^ .vfh i—i —i— -gri t r» 八 jlu /-r 白 八 

V 5 C O 定俩疋刀性 no = W ) JW ^\^ m ^ 

4 

I * 

R = R^-th 

厂 厂 _ 

t 刀头奴，则 !: 


H/ 3 — r 0 / 


由约束最小二乘定义必有 


即有 


| y - x ^|| 2 >|| y -^|| 2 
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Ilv—Y ： /?ll 2 — llv^ YM 2 

^ * ▲饜卜 ，li ▲ • \\ r 

I XCp-p) \\ 2J r2(Y-X^yX0-^ 

■ 

Jl II \^/_ 112 丄 __[ \rri\ 

v || yvt/1) ~r l,l\i jxpj 


由 t 的任意性及二次函数性质知 

/T>T Vr\\ f \ri. _rv 
、 I — 八 pj j \0 — U 

( x / y - x / x ^) / 6 =o 

I 

由于 6 是垂 直于; 的各行构成的线性子空间）的 年意肉 

詧，所以 

， P ▼，, 


即存在 A 使 


、欠’却 一 X ’ YG / zCH 7 ) 

X f X ^- X ' Y = H f X 


hh 

此干 . 


我们可以指出 




/-lx A1* .4 ^ 曰 - 丄 —‘ L ±* 、 I -/ r * r^r ■ / ■ ■- 1#K ， r i #+* —r *： /cn i-^ a 

帘和、 i ;' 列米〒 / j 、 一唯 1 户叮不:匹，伃仕，尽汗仕灶个 m 视丁彼年产 

&假佘 B. ‘ ' * … ' 

严严， * ^ r 

(2) 对于带约束的最小二乘估计，也可以建立相应的高紐-乌 

㈣ “裡. 1 '、 ' .… 

，蟫 ， I I /、/ - 

例 3.3( 续）因只有3个爹数，錨 1 们可用消去多余参数法来 
找出 A ，氏，氏的优良估计.令 ' 


3^1 


) 2 ，之 3 . = )3 


则有 


_. — n 1 _ 

Z\ — U\ n~ e\ 

. r ^ 

z 2 =dz 十 e 2 

；~•(!' t — ^ 

〜 O v V、. v “ • 


即 


I 〜 I 

L ^3 J 


— 1 


0 ^ k ! 

id \ ， r J 

\ C ) + H 

-*■ 1 1^3 ) 


最小二乘估计为 


9 . 

mm i 


之 2 了之 3 


▲ 

e 2 


zi +2 z 2 一 z 3 
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' O 

« - 

* 

I 

， l ^ 2 # 了 I J 2 I J 3 7 W 

• ^ ，- * 

竹 ■ •, 

乂 

1 

-A A A I 

6z = tz— 6\ ~d2 = yz —i (: yi +3^+3^ _ 兀） 

<3 

雇、之有 ：’ ， 

= 3 ; « ~ Y^i +^ 2+^3 — tc). (i=l,2,3) 

易见 

Ehi 

Var(<9,) = -?-<t 2 <a 2 = Var( v.) Ci = l,2«3) 

， • f " w m ^ w 、 r r w r 

o 

_ i 

这表明用久估 i 十义仏 用单个％估计式有较小的方差.这是平滑 

的好处. 1 

… 4 * • \ 

tel Hlft^rn S rn -tv 士红 A 口 rr 3 ^ r 71 斗 士 £ko litil -^： m’"ST "f n=t 

ji I 术 ztimm 明口 木丁広不 wf，jwj 刀 ^e h j kA^=i m 

0 .\ 一义 = «yi 
02 — A = 3；2 
dz _ A = 3^3 

、❹ 1 +込+沒3 = 7 T 

同样也可解出反 = ： y ,— 去(3/1 ~ f ~： y 2+： y 3 —兀). 

/;、： at « m 、 一嫌杜 从的料治 

\ -*-*- / ^/v J s%K 9 J 9 — ^f^ IM ri HJ P W J kL» 

作为本节的结尾，我们对最小二乘估计的优缺点要说几 句话. 

jh ， tnA、j 场 I 土俠坐 

' Y = X 3 -he 

I 

的未知参数^进行估计时，广泛使用最小二乘估计.、当/满秩时, 

所俱的甚 A 一乖估朴县干他的而日县胼右线株干偏估 i + 由古 荖晶 

I I W " V -^-w -4 一 . ，_、 I H w KHVJ »-• V l"4 j 1. // ■ I J 1—^ /u KPVJ I H ， _ I -XV 

<* 

小的，计算也不复杂，只需解线性方程组.这些都是最小二乘估计 
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的仔占 伯县 .社 不县女 体你楷 沿下.畏 /|\ 一垂杜彳： f 规林 

MV l/U >V\\ • A*^ 7 y \ ， I - yst, l-L- ■ 山 「 J I r9 vu I 7 *4 - 暑 、 in f |- • 

< (1) 当行列式 I xl I 接近零时，最小二乘估计 j 很差，取值很 

TX ：^ ::士且 cb 工 

ac , > Jka/t m j 


Cov 0^)= a 2 ( X f X )~ 1 : 

w w 

x^r znr I xr^ XT I +立 j 匕绝 AA it^ VO n-4* / ilz V A/t Ar 7 ： t\ j 匕 /r\l JjU Z4^_ ,UU 4d -V* o-+ 祕人 
W^U I A A I J 女 3ii 今 tPJ 旧 UL 口 、 J、=I A U、J 廿， _J3aikAfl!i 级 r 土 TH 穴 P、J 肌瓦 

出现这种情况），就得考虑其他的估计方法.'一 +重要的估计是 

■w ■ ^ w w w w v "■ w ▼ w ^ r 史 ■■■ ■ ■-— ▼ r "- ■- p v * w ^ — 


3=( x ， x + Ar>—w 

V • 

苴由】县 TF 矣齡 Y 劣 1 = 0 时3刖磊爪一_估讦 ） ； 汶釉估 i + 痛稔岭 

，、 | , 、 y>w 1 ■ ■ jv"v 、 1 ,、 v p y 卜 『，攀 - -*w - j / 户一 ^ ii 11—I *■ I r 鏰 .… a 

估计，是由 Hoerl 和 Kennard 于 1970 年提出_，关于其中的参数 


A 的选取现代有许多研究成果，这里就不细述了. 

(2) 最小二乘估计是基于最小化残差平方和而得到的估计 


法，它可能受到个别数据的较大影响.换句话说，，稳健性不够好. 
30多年来，稳健统计的思想和方法得_ 了很大发展.比最小二乘 
估计稳健的估计有最小 一 1 乘估计，它的定义是：若 = ( 闲， 
街，…，印 y 使得、 、 


Zj \yi~ ( 工 npi + 工 i2p2 H - r x ip pp) 

， 1 = 1 

、 ■ fe _ _ « a-^t _ t # fe - § I . \ I 1 ^. I 产 - / I - 、 t ■■ * 耋， 1 膠 * >I 

达到最小，则杯 f 是 p 的最小一來恬 tT . 不眾小一來怙订安用到 

线性规划的方法，其统计性质的研究也比较复杂，已有不少研究 

• / - 

* 

1 - ^ 

成果. 


4线性模型的假设检验 


( 一 ) 参数线性相关性的检验 


人 A 入 l\ L#t -T^tl 

筘疋琛饪悮型 


y = xr^p n n 

* 息 I v x • • y 

其中 X 是已知的 nXp 矩阵 (《>/?)# 是 p 维未知参数向量， Y 是 

~她 mi 働 1 rfrr 县。且 IC&inTiff 女甘枯庇沿 舶由 R tV 曰 n 

， ‘ 〉 pi/vui>;，j i"j 里，。 /^r-mvL-^VN • ，- n I 鑌 ■ 上 ± itx 认 ipt 以 f ^\* 

e 〜 N(0 ， ff 2 I) (4.2) 
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L'i 下 U ! r ^ Tit Y 的班.々志元 PV r' : 11 、 ' 、 

I 息 1 l"V V，W 7 、 * % V : L 

、考虑检验问题 v - 

H 0 : H^= 0<-* H a : 0 :' ..、， （ 4. 3) 

其中 HSsXp 矩阵. •、 .• 

1 ^ ' ；\ 

.‘ W = M ( 幻 =( R p } CZR ” G 
Wo = { yj~ Xj3t.Hj3—0 R p } CZW 

则假设 H 。 等价于 eey 。. 设 W 。 的维‘数为 g 且 g < r . 

我们用广义似然 t £ 来构造检验 (4. 3) 的 4 验统计暈.记 

以… ， ! : r 

， &={( e ^ 2 )^ ew ^ 2 > o } 

• f - 

%： : 06 = .{(6 ， (7 2 ) ： 66^6^>0} ' 

易见 T 的分布密度为 

^ ( 1 \ 

/>( y ；6，^) = (27 r ^)™^ exp |-^|| y-er } 

这也是参数 (6/) 的似然函数.不难看出，要使这个函数达到最大 
值，必须且只须选$使 II V - $| 2 最小，再选 ( T 2 使表达式达到最大 
值•记 

2 .^ _ ^ r 二 ^ ^ • t r 

^ rroj i ，亡 0 = rroj i 」 ， 

w w 0 

B^O ^( Y . P . n 2 )th A = p ^ 2 =— y — 幻 2 时4大 ？ II 晶女倌 min iy ( Y . 

厂 '一 ，从一 、j r iy ^%^ /、 | ~x^ ir 、 * 7 

n ( f ,( T 2 )60 

芒，<7 2 )，在尽=|。，(7 2 =丄||1"—吞| 2 时达到最大值3叩 p ( Y ^, ff 2 ). 

n • 1 •. ($， a 2 ) ee 0 

干县广 c 似妖屮 

嘁 / / 、 iz^> d\\\ *^w 

sup p{Y 9 $ia 2 ) 

A =— --- — 

sup p{Y^,^) 

e o 

_(|y-lo| 2 ]^ 

= iiy-fii 2 

V u » VI / 

注意到 Y — f 丄 W ， 而#—色 GW ， 故 Y — #丄#— 6。. 从而有 
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IIV 

II 乂 


II y — 芒 II 2 十 Ik— 芒 。 I 


所以 


A = 1 + 


4 ^ 1 I 

|6-6 o | 


R 




以 ㈡㈣ > A 

\\ y-^v 


令 


IHo || 2 /(r—g) 

F = - 

I • w ^ 11 « / ^ 

nr / u - r ) 


对否定域忪>久。 } 必有 C 使 { F > C } = { A > Ao }. 因此 F 可用作检验 
统计量.下面的定理给出了零假设下 F 的分布. 

Tin a , Z4^ lu- 4# ^a\ / a 1 、 j/t. / a o \ r4i> 士 mil -A- Itn 2rL t t i-4^ 

At 理嶸 • 1 A、J 级丫土快坐 、 t 丄 /， KA 吁•乙 乂 汉 Zl 0 ； J 乂 

立时，统计量 F 的分布为 F ( r — q,n — r ). 

、 - r* — * - — - L - -rri_ L 一 ■■— — i I« - - . ^ t - * - »=^ v 

Ht 明：仕 K " 甲取怀准止父盎匕，石，…，匕（叼刀夕！ J 同重）使侍 


H 


A 


为 W 。 的基色，…，&为 W 的基•记 


v = ($1 ，$2，••• A ) 

T7 - / ^ 今 _ 今、 

V 1 — VCl ，？2，…，？以 


V 2 — (6(7+1 


+ 2 


，乞） 


irttl 

m 


V=(V, u 

T 厶， 


令 


之2 


V f Y 


则 


n 


Y = VZ = 2 
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故 




r 

= 2 j Zi ^ 

i = q+l 


又由 Z = W 得 
其中而 




r — q 





n 



/(r — q) 

1 = ^+1 


XI W /(« — r ) 

t = rfl ' 


Z ^ N\V ^ . 



(因为在 H 。 下应有$6，。，而7 2 的各列垂直于 W 。）. 


于是有 




技说日日 a . 

> ^rw / 一 〜1 7〜 t 


Z n 独立，且^+1 9^+ 


z 固为 N (0. n 2 )^^ 

-▼Jl | ^ ■ ， 、 ▼，分 , /， - I w 


所以在 H 。 下有 

〜 X 2 (r — 0 

^ * = g-hl 

丄 Vd _ 

2 / j ^i 八 •' 

O , = h-i 
■ » _ • 

且二者 独立. 故在 H 。 下 F 服从 F ( r — g ， n — r ) 分布. 证毕. 
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5 * 葙们可 L ] 不楠田线杜.右问将 嵌诵 吉狡类揀嫌件醫 FWR^R 

_ ■ _ ^^4 it ^ I / wI—!•* j * I ' rr^ - ，一 《u '，V ， 八 w ，夏 ■ ， 分一 ► 卜 / ♦ 卜 

上 L A e^ I 二 i — # I - \ I ± v» _ f ▲ #*#- -4 ■* >T# #*l. T T * A ― r-* 上 L A I / 1^ 、 I r-t 

的 1 个敢小二飛 15 . rr ，/ if Q 刀 p 仕约來汆忏 H / i #= u , r 的一/广取小—米 1STT ， 只 

綦用；^和分别代替上文的#和心，不难验证上述推导仍然成立.这时 

▼ T _ , 

*. w ' 


ll ^-^ ll 2 = ll ^-^ ll 2 是残差平方和 Q ; l | V -| o || 2 = Ili ：- X ^ || 2 是约束条 
件邱 =0 下的残差平方和，常记为•于是 ile-loll 2 =Qh-Q,F 

'A 、 ■‘， - , , :. , 4- 

( Qh — Q )/ ir — q ) 


O/rn 

\ ， ， * 


•:，这是常用的公式， 


用0表示 p 的最小二乘估计，则见定理 3. 1的证 

的、么， 1 

74 / ， < • - 


e=Y~k^Y~Xp 

称^为残差，记 

、’， ， • .“： ^ 我 : 厂 作 

Q = ikl 2 = D k — (aA+:▲ + …+ 工 :/^/>)} 2 

t = 1 

它是残差平方和，和 Q 之间有如下 关系： 

系 4. 1 对模型 (4. 1) ，设条件 (4. 2) 成立， g 为 0 的最小二乘 

估计，则@与残差纟独立，从而冲与残差平方和 Q 独立，且 


/ O 2 y 乂 

〜X in - r ) 


证明：不论假设 H 。 是否成立，在定理 4. 1证明中总有 Z 
N ( V ^， a 2 I )， 从而独立性得证.又故 e 与^ +1 ，匕 +2 ，…， 
正交，因此 


6” 




1 

• 

• 

參 


4 

• 

鲁 




6r+l 

• 

• 

• 

. > 


0 

• 

• 

• 

、 0 ; 


I ^ 

从: 


^ r + 1 9 之 r + 2 , 




* • 

Xrif 1^1 7VT /rv 一 2 、江 士 m a 75T An 
dn 似 ALIHI 八 W，a J 7JW . J 7E H J 冲 


n 


Q/a 


含 2>， ^X(n-r) 


t = r-hl 


I 


证毕. 

• 223 





r 一）金:齡雄柹铂仝的松跄互 《 倌反陆 

\ — / 1^- «^u HH |^ ~V •MOL^ |l»l ■—» 


上面证明了 # 与 Q 独立, ^ 与 Q 是否相互独立呢？从下面 

6ftkf 仏 cb 收加 I” 券说 I ^4 V o 1=; n Yih ^V o 6ft rtf >fdb^ >Wr 

w wj m - ■ tt「j ka 旧列，二 q 八 in qyv h-j ，p —y v< ga^ _u^. /vj [j u j ^4 im 冰 ■工 


组备肴如下的一结论： 

t 

f^im a ’ vT-t*-t^r K 4 \ / >i 1 \ jit ^ i 士 / a o\ 4 v 一 ’n 曰 n A^t 77 f i# 4 * 4 ^fe 

>vj 俠尘、寸 • 丄 V ， t 5 C^K 1 TV 4 ：. flXi^L Jt P 疋 jj P'J H J I 口狄 

> 


性组合 j 是 /? 的最小二乘估计， Q 为残差平方和，则以与 Q 相互 

V 嘗 ■ V 邏 <v •- - ▼ ^ w W v W ■- ■- - ^ ■■ ，■ w » ■ _ •- - *- 一 


独立. ..:•、< V * t 

证明，闵//?耵估.由宙理14的证昍付耝可知有 ， f 

W mm m ，， « ，■- — ， 翏 ， •■ ■ ， / ， ■ ■— ^ " 一 W ^9 寸 ， ■ ■ * ，， "-置- • •_ ， ， '•署 »■<# 

p ( x ) 使 

c f ^=a*Y a 

在尺”中取标准正交基 U ” …， e " 使得^ ,在，…，&构成 〆X )的 
基，记 " 


令 


V \ = (& ，$ 2 ，•” ，€ r ) ， V 2 = ($ r + l ，•••，$”) 

V =( V ；^ 2 ) : 


/TF _ T r/x 尸 

L=W I 


则、 


z 〜 mv ’ xpwr ) 

故之1，之2，…，之 n 相互独立，又 


c) =(a # )T=(a # rvz=ia ) / (V 1 ,y 2 )Z 

= (( a * ) / Vi 9 0 )Z 


r 



= < piz x ，々，••• fZ r ) (4. 4) 

fl *J # 

而残差 e = Sj z u = i ^ i 2 = y^i z 2 t ，所以 4 与 q 相互独立. 

i— H-l „ i— H-l 

u ^ bfel 

HC ^ p . 

系 4. 2 在定理 4. 2 条件下，如果 X 满秩，则 S 与 Q 独立，且 

: 『 j- — - ^ - - * - 

& 〜 Napwax’xr 1 ) ， ,QAr 2 〜 x 2 (n-/>) 

^ HH . 会 fr 一 # 主&/门 口 y ^ mil/x 杳 66 广去 k 且石 r>f 士 

ku- ^yg ； 卩 u 卩 ] 〜 ii j i_i : ec wu 人 a irs> ^la. tvj i 丄芯 、 u j ^ ^ tik w i 

的.从 (4. 4) 知在只与 ，…， a 有关，而 <3 只依赖于 t+i ，…， A , ， 
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册乃与八础古 m Q=C Y f V 县 V 的祕处铂各 _而卩 服 U 

H^. ^ ~^J V-H -LL- • ¥-^ \ ‘及 ‘1/ ‘ 及 ▲ ▲ WV O% l-i-<^CL M ^ l»M ▲ ； JI^ A^\ 

« 维正态分布，又 e ^ = 沒 , ,cov (資） =^ ex ' xr 1 ， 故备〜 

^ O ^ l 1 V M ^ ^ - - t O 〆 、 

(A A) 1 ； . 从足埋 4 • 丄的糸知 y/〆 〜 z 、n — p). 

^I ^ • 

定义 4 . 1 设 a ' Y 是的无偏估计且 a6 //( X)， 则称 d 为 c： 

Aft/ik IGfe^ 

卩 yrr wa^Lu 

从定理 3. 4 的证明过程可知，若(: > 可估，则 c 的伴随元存在 

«/>* 、會 ， r .vKt rt_L , ， JLt* AU ty^A? 1 ~~' V t . 

喂 一 ，3 a 俩状 ff 、 j ，〔的讦瓶兀刀： v ， 

n = X ( X f X )^^， ” 

wv « 昼\«昼 一昼， 冒 


(这时用 c ^ = c { X f Xr l X ^Y=ay 来估计 c>). 

^IB A a (A 1 、 ^Ot^LlAir A 9 、 c^tV : it 忠 Jo nt 

AC,>± ^ >VJ <>Ki ■工伏 生 VT ：. 丄 / ，认不 m. WMXi 」 I- ，； 7T^)CL/j 卜 J 

為 


估 (c 专 0) ，则 



〜 £( n 一 r ) 


其中 a 为 c 的伴随元， r 为X的秩， 

v n — r 

1 证明 ： 由定理 3. 4 的证明过程可知于是> 

VarCc^) = VarCa^) =a / Cov(Y ,Y)a 

J -IkllV 


故 

> 

丨 A # A It II A 

C ， p 〜 N ( C，P〆 \\ a\n 


又由定理 4. 2 知 4 与 Q 姻立，又 

QJa l 〜 iC 、 n_r 、 


: Ur 
HA 

即 


■i 


c 


4 


a 



Q 




t(n — r) 


n 


c (冷 一 j 9 ) 

MW 




t(n — r) 
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l\f L AA Ttn 、人 A »1 -^1 -=rt i \ t 、林 An J 5 rL TT 人 r^n 4 J ^ 、小 SXA /士 ITT i、JTl 

^ J 以工 ITJ 理化’，供 1 U 肌 Kl 以进1了1扠议例迈互 1 日 

(1) 若 cW 可估，要榆脍' 

■ V | - ▼ ■ W ~ w r - 

Ho : c ； j3 — r 0 

则可用统计量 

， * 

cR — r 0 

t = — ~~ ' (a ^ tc 的伴随元） 

_ a II II I I I p, 

II a II 
■ _ < < 

在 H 。 下 t ^ t ( n — r )( r 为 X 的秩），取 A 使得 

f P (\ t \> X \ H 0 )=a 

mil Vr lU TIT IT 込私 AA，RT <±r 4 cfe m i I 、 < \ 

^*jix a /jv 丁 r \ [ c I ^ a /. 

H 0: cXr 0 ， H 0 : c » 等假设也可挙似地使用 i 统计量进 

Z 一 - LA . 7 t 人 

TT 155 题. 

(2) 若可估，我们可以求出的置信区间.因 

4- c’P ,、 

' = TO ■〜 t(n _ r) 

H ， 

取 A 使 P ( U |> A )= a ， 则的 l — a 置信水平的置信区间为 

r y w II A I ^ II II A n ' 

]^C I 3 — A \\ a \\(7 jC p - TA\\a || ff 」 

例 4.1 我们夹检验一下例 2. 2 中樽型的相关性.这里 

»■ — ， _， W w F ▼ v WWW • •r 

人 = IZZ ,08,1 U 8, m •，上丄 UUJ 

y=(o m m " •川 8 nV 

• 、 v • » w 7 9 ^ 7 9 7 7 ^ ■ V ， 

X f X = 2 685 141， YY =3 376. 312 5 

最小二乘估计 p=H = 0. 035 44,来检验 

H 0 ： H =0 ， 
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刖劢 


7 


检验 H 。 反 =0(/?= H ). 易见 cr=l 的伴随元为 a 


xcx ^)- 1 ， im = v ^ ir ， 取统计量 


ffll-ll 


在 Ho 下^ ^(11-1). 计算得 




10 


cry-x xh^) 


= 0. 379 26 
o =0. 615 8 


t =94. 31 

I ■ ✓ 岣 a 、 / \ J — _/. #_ a A n ^ / V # 、 - 1 - 、釐 a < 八八 Ir^t t - i ^^ /iJu t t 

宜恃 cuu) 分伟的 i —u. uut> 分位魚 ^ ■ 刀 i it>y, oj 见 m 坩钯付 o. 

星团距离与速度之间确有线性相关关系. 

用上面的 tr ，|| a || 还可昇出 H 的99%置信水平的置信区间为 
H -/?| <0.001 2,即 He [0. 034 25,0. 036 63]. 


q cr Kn iF-t ZV +H 

s o \m w Jr v \ 

* 

% 

-fix /■>-! -X- -4+* -r*l m C* r\ S* A »rJ^ fiitt 、一 JLU Ali LtK JcUr -rtil JLU ihrt Ttn 、人 Tir 

双 1 U 牛 13 利用 S ^、 S 4 T 违兑的软枉保型 的一 取理化木妍九 

I 

§ 1由榣 出的问 的斗拓 1 问 M _ 我们的屮劳占县闵亦畺 V 与白亦畺 

v — I ■ _， •"» ^ r_ ■，，― i 1/ p I _ J - ■ _ f 丨 •、、 r • ^rk ^y ^ ■—i ^rk 

Xi , X 2 »••• yXp 的下列数据 

nr ^ - nr ^ - ••春 nr - ■ A f . 

-^u ^\z ^\p j i 

y 工 21 工 22 … x 2 p y 2 '〜一 

Cb . 1； 

• • • • 

_ _ 學拳 

• 參 l 參參 

X „1 JC «9 … JC … v „ 

w m ▲ ,• m r m £^ ,_ 

需要解决以下 问题： 

门、 A, 与 T, .T„ .… .T 县 本右下 剂钱株类玄. 

\ 丄 / Jf 丄 7 一乙 7 7 p yst^ l—l nj I X -J <i^V l-L> ， J、• 

y = ^0 ^1 +/?2 工 2 + … (5. 2) 
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宜由刖县本 H 被 A 插垣 T 芴|说柄才 

/ 、 I 一 w v 7 ” 厂 |1~| ▼ 以丄、 i ，/\*_, %tr ' J I，J I / 4 \^\ ->-"V 

: y ; 戽 + A x i 十…十 A » x /- 

古奋以 
n AS、^v 

(2) 若: y 与 a ， x 2 ，…， x # 有 (5. 2) 的关系，如何 找出戽 ，爲 ，…， ft 

n n ... A ' 

cm 口 H 阻 po ， pi ， … ， Pfi. r 

(3) 如何利用回归方程 

V W -W" 9 


讲杆雨涮和猝制 


;= 成+庆 Xi +j§2 ： C2 + •••+$〆 户 


(5.3) 


我们先回答问题 (2) 、（3)，再来研究 （1). 

(一）回归参数估计 

我们用§ 3中介绍的最小二乘法来估计回归参数.记 


X =( E , C ) 


其中 


E= 



參 


1 I 

丄 ^ nXl 


C = (Xij ) n x p 


并记 


o — 

春 

jm 

J C — 

、 

e 2 

4 


3i 、 

yz 

m 


争 

鲁 

b 

• 

• 

、 e n ) 


m 

參 

<y n > 


则由 （ 5.1) 和 （ 5. 2) 有 


Y = X^~{~e (5. 4) 

在回归分析中，我们恒假定数据 <5. 1) 使 X 的各列线性无关, 

nrt xr AA AL • I -1 丄 5? o A*rf o 曰 丄一 - /-U > I JiJL. 

PH ^ ITJ 饮力 p 丁丄. 出 S 6 沖/? WJ 取 / J 、 一米怕汗刀 

^(X'xm C5. 5) 

、- • - - • - , - • - - ' *w — ^ 

我们要找一个更便于计算的公式.记 一 

n , 

iij = y ^] (jcki ~ x . j )( x ki —王”) 




228 





n 


l 


ty 


yi (joki — U (: y ▲，— 夕）， i = 1，2，•••，/> 


k 


n 


2 


yy - ^ a 

k 


L = dij ) 


pxp 


L 




Hiy) P 


XI 


X 


X. 


X.z 


% 

春 


lx.p ) 


其中 


n 


X. 


n 

W V 


y ] x ki , 兩 i ， 2，•••，/> 


k 


n 


y 


n 




yk 


k 


这里 L 叫做相关矩阵.易见 


n 


iij = y j 工 ki 工 kj _ 似”工 v 


k 


=C C — nx x 


xr 
A A 


n x 


(n 、 E ， C\_ 丨 n 

\c f E C f C) \nx L - \- nxx r ) 


n 


l 




E 


ockiyi — nx 9i y 


X f Y 


EY 


ny 


Cy 


L 





A t ■ nr 

tv j - ^ 


用矩阵四块求逆公式可得 


(x f xr 


+ x f L~ l x -x f L 




-i 


n 


v 


L 


-i 


x 


L 


-i 


从而 
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(X f X)~ l X f Y 


- nr 


f L ~ l L xy ^ 


L~ l L 


K 


工 y 


I ^ t r\ r\ A At ■ ■ * ■ -/ I • ^ I * 、丨 - 

rj\kA po ^pi ， … ， p P iw 取 ， j 、 一米 icnTyi/ 


p 


Po = y — 艮 i 工 .i 


残差平方和 


，二、 


參 

春 

鲁 


A 


Ift J 


L 


-1 


r/ij 


2> 


争 


l 


py 


L^L 




^ - yy j 


Q 




y-X ^|| 2 = Y f Y - Y f Xp 

l yy + 2 — f T 


f xy 


+ ny 


l 


yy 


L f xy L~ l L xy 

p 


lyy _ > : hy^i 


误羔标准差估计为 


：_ / Q 

由定理 3. 2,如果设 (5. 4) 中的随机项 e 满足 

« 

Ee=O f Ees = a 2 1 


则最小二来佰计是尤偏怙计，且 


Cov(0 ， j§) = a 2 (X’X) 1 


r 


ff 




n 


+x / L~ 1 x 


x 


-l 




-L 


x 


厂 ^ _ i 


/ 


En : 


(T 


(二} 预测 

右了 rnn ㈡ 七扭 

n j y—I yv 


(5. 6) 


(5.7) 



(R 

\ v • v / 


參 
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y = po +A J： i + … 




IDll 对一►扭白亦鲁值= T ? . = t 2 . ••• . T = T 0 . 茄垣 A ， 的雨刪 值 

/ 、 J ，，V ^JLL I—I |_E3> 一 1 …丄 7*^ 厶 … L ， 7 p -*^/)7’\J|VJ W V 'l-^S l^SV 

y=po + A jo°i H — +_ P 工 I 

易见 

E：y = A > + A 工? + …+/? 〆 5 = 

即 S 是期望值 £^=^+ Ad + …的无偏 估计. 

下面来找的置信区间.设 （5. 2) 中随机项>〜 iV (0, ff 2 )， 
则令 . ， 

c = (1，《 r ? ，… ♦ jc *) / - • f 

▲ 

有 



是一个线性可估量(仍假设 （5. 4 ) 中的 X 满秩），由定理 4. 3 的系 

* 

可知 


c,P — c f p 

i 4 c \ X r X)- l c 



1 


记 

则 




c r ( X r X ) _1 c = — H ~ ( j ： 0 — x) f L l Cx ° _ x ) 

n 


囡此 

w -， W - w 

f= L (A + A - c, h 

^ \ iL 

a A ^-\~( x ° ~ lc ) f h~ l ( x 。 一 x ) 

v ^ 

査 r 分布表知有 A 满足 P ( M > A )= a . 

4 f 



u = Xoj , I — *h ( jc ° — x ) / L ~ 1 ( x ° — x ) 

n 


则 Ey = cj 3 = l 3 o + 负 + …+/? 〆 》的 1 一 a 置信区间为 






To 丄 5 丄 … _ ... _ 

Lpo I pi^l I I pp 丄 p Ujpo I p 

下面我们来求真值 y 的置信区间 . y 的预测值为 
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预测误差 


y = 成 +i§i xf +… +^jt 0 p = c’& 


— A • A « A • ^ 

以一夕 y^y ^ p 

= ( y ^ c ( 3 ) ~ c f ( 0 — p ) 

— V V w 

拓 znf … 曰 jcii / c . <r \ Vr* _ __o „ 一 —o hL am . 人 Ac A/t tiin 说 il 

oijs.^ 4 y 疋快單 vu; aJVL ji — :i ， ••• jjop—xp y^xr^—^vm wj ^cm 

值，所以我们仍假定对应的随机项 

» ，- ■ - _ » ■ — w ~w ■ — ■ ^ ^ — 

eo = y — po — pix \ - p p x ° p =y — c ^ 

与前 w 个观刪的随机 顶 #? ， .■#?，.•••.#?_ 灿 办 日右和同的 M ( 0 , rr 2 -4 V 

寸》碡 ^# ■- P ■✓'W r-p ^ I /MJ 7 才 u 7 ^ ^ fl ― J~I* % -4 V K-l I ^ 9^9 ^ 

布，这样就有 

Var(^) =a 2 +a 2 c(X f Xy~ l c 

' " —_2「f 丄 ’ 土丄 ，一❶ _■r 、 , T 」 l' 40 —: •、*T 

- o 丄 I 一 I V*>c JL / X^t \JL JL / 

L n J 

t ； 匕 IW 

m 以 

I 

1 + 丄 + (JC 。 -X)，L -1 (JT 。 -x)ll 



于是 



令 


(5. 11) 


^ = Aa A /l + —+ (x° —x) f L~ l (x° —^) 
v n 

则真值 : y = ^+/?ix? + … + 仏 x$+ ☆ 的 1—a 置信区间为 

广 I o I I n I n I I n I ™n 

L^O 卞 〆 1 工 H - ^lipXp— VyJJo -riii X\ i - h/V3r A t V 」 

l^hk Ev 的晉佶 R7§1 思女.闵士 V 屮 Fv 名了一个随机顶 〜_ 

^ w | h »~，、7 r —» ^ v ^ ^ p I v w /、 一 v ■ 

. 、 I ^ \ > %. 、 - * — # 量 ■ _ ^ ^ ^ ^ ♦蜃 ^ - #‘■ ^ r\ /\ ^ n - Jt » > i 

应该汪葸的是 （ 5. 11) 成立的汆仵是（ 4,… ， 3 ；) 伢甘原来 

的 rniii 口进荆 i^m^iam\\r …^ 、 , 、时亦甚 + 问的光玄沿右 + 

wv i^4 y—I vtc j 乂 <j 、 yvuus-j \ 丄 1 ， ，丄户，） /k] 八一 i*-*j mv /v 小 ，rj /、 

的改变 . 因此 (5.11> 的〖统计量可以用来检验假设 

ZJ AC 值抓沾撕描 / — 0 … —0 ‘•、 hr 法 士 fFH III ! 七祖 se m*(r 

“0 : 取 I W 太 y PTJ 双 W v 乂 1 ， … ，乂 /> 比」 jy — I 人 f 牡 /71 厂口 双 

据来自同一线性回归模型 … 
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虫 / 的对 * 值 Bit 拓 ." 0D ?KI i0l ( ( t '? . ••• * Rd * 

- « — . " V -T-J ，’ V 、豸 ^"1 、 I w lH-i V I iS3» p ^ 車 * U 7 •^厂 l-^VJ X ^V，1 7 7 一 

变量间的关系已有变化. ,: * 

am c t 主口 1 且 *arra ia 崔66古： Wtua 治女麻上太祖 分新 的 

I7，J W •夏 ^ ^ J- 尚丄 + 丁 WV« 0/VB 只 1 、十 3W ； — 3 十 1K1 W 双 P V 

数据.从数据中可以看出.，汽车数增加时车祸数也相应地增加了. 

rrn /m vt-t -h* 4a 私 / . \ Atr 士 / 、士 +i、r 人仙 xa* ra.tr^t—t^ ii^4ai*>dr 

WIJAJ 干俯双、3^州八千双、〜不 JM 百统 T 土 UUICIJV IT 畀1守 

■ :i ' n=ll , 2^, = 5 711,' S^ t = 2 396 

Exf=3 134 543, Ex t ^ t = l 296 836, E^=539 512 

求得回归方程 

^ = 55. 86+0. 312 Ox 

相应的 F 统计量 

F=132. 0 

ttt r4-f rtP / 1 n \ AA 17 /V -fc 1 r\ c\c\ I-^t Jb 1 n d • 7TT m ra il-i -4=* 曰 
H ra K VI ， ay CPJ r UV 兀瓜冰乃 丄以 . QU ， >tS7E 

显著的- 

t V 

, 1 

*5.1 有关英国车祸次数与有执照汽车数的数据 

' ~ 车祸次数义千次）、有执照汽车数 x ( 万辆) 

〆 ■ - - ^ ■ 1 »■ ； 




1947 

1948 

1949 

1950 

1951 

1952 

1953 

丄 954 

1955 

1956 

1 QC 7 




,166 

a 

•y 153 
177 
201 
216 
208 
227 
Z 38 
268 
268 



352 

373' 

411 

441 

462 

490 

529 

577 

641 

692 

743 


下面我们用得到的回归式进行预测 .应当 强调指 出的是 ，在 
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免院丁你出尤能仿 A 7 迫拇始 ：々+主玄册 始苗 ' 庄 Mb 通由 P 如 

pm 、一 l- I r I ， ， 「 ro i/v w</u y i 小从 irj —r- wv / i jrn ? k-^i /v »v u_i 匕 j y>n 

统计关系的实际背景可能有变化.在这个问题中，必须对与发生 

左：祖古 ★AfiFH 赛 : 么 ; 冰 r LV4m / 又此功六 :! B ~r 曰 iVt 必■你 
十 TFi^R ^vOV m 42E1 J 叶 ; tW 口兀， Ui^H : 7V W TH 人遇丄穴 口 ; I 久 / K 0/V 

况 ，新 增加的汽车的种类和性能以及人们如何使用这些汽车等 

咏 'rV |U< I—r AA ^ r^ti m B ~x^ -L. AA -ste 、 

守，込空 3 千例书大 tTJ 反纸四杀定仅书 J ^ tPJ ^ VL . 

相对于有1 000万辆汽车，即 x ° = l 000,可得预测值 

'W w ，子丨 , ▼ ，'^ ，- r . _ t »■ - ， w 

；y 〒 367. 85 f 

艮 D 可能发生女约367 8 SO 汝主媒.爲见汝11 ) 的 z 统计量 可 

^ 1 ， m - / 、^ 言 一— •x ^ v I r , ▼ ~ m '一 ▼ 一 一 ， f-p ^ 一 ▼〆 w , ， ■ l ， 

以写成 




— t ^ 2 // 


丄丄 


由此可得车祸数的95%预测,区间为 


367. 85士 （2. 262)(11. 18 ) J 1 + ^ Q 5 ^ 19 ^ ] 8 

Y 丄丄 ^\J \J ~L %J KJ 0 \J ~X 

• • m 

即 -328 227 灰到 407 473 次之间 .一 

假设在下一年内，交通管理部门对违章驾驶进行了更严厉的 
处罚，汽车数是800万辆，发生了 270千次车祸.我们想知道汽车 
数与车祸数之间的关系是否发生了显著的变化.设 


可以算出 


及 f 统计量值 


x ° =800， v = 270 


3^ = 305. 45 




= -2. 54 


，口 > C*N itx tx . 

H 。 ：车祸数与汽车数关系不变 
h 1: 车祸数减少了 

可以用单侧否 定域“ < A 。} ,9个自由度的 i 分布的 0. 05分位数为 
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— 1 RQm ni 4 V 仿粉 士一 9 R 9 A 0 爪 下 ill 士左据 粉施 

J- • ww’v. v J- I ;/' / v w • W w A 7 J^-Xi ， J 、 I w • v v I 4 ~^%~ ir ? ^y/V 7M 

实减少了，水平 0.01 下不能否定原假设. 

/ — \ 4 ^djl 

V 二 / 促 m*J 

控制问题是要求因变量以 1— a 的概率取值于区间 [ A ， B ]， 

I * 

> V . . ■、 . • ' 

•、― • t=a ' - > - tJL* *1^.1 __# 二 1 / t P I I ■ t ± \_1_* Jll ^ •、— t nr 上 »— 

I 口 j 目艾重 ii ，: c 2 ，…， a m 设制任 rr 么氾 围内. 这定顶测 irj 越的 iz 

Tot -Sff! 

1^1 f ^£^， 


査 t 分布表得 n — f —1 自由度时 l _ f 分位数（即双侧 a 水平 


分位点) A ， 则下列不等式以概率1 一 a 成立 




(y_po 一 Pi 工 I 


# • • — 


PpXp ) 




a 


2 


+ 


一 1 


l - t * - f - 

具甲 


x ={ xi ，: c 2 


) / ■ ■ - / ■ ■ - ■ ■ - ■ ■ - 、/ 

， X = \X * I . 2 9 999 * p) 


根据要求从上述不等式就可以找出： ^ ，: r 2 ， 

斗 -**r 

潤 、 /a gsi • 


的控 


例 5.2 低钴定膨胀合金由铁、镍、钴、铜组成.在控制杂质含 


■ • - ^ • # 倉 ▲ t t ^ ，•膽 —m ^ k «^# A I »t V _ t u A A H # t i - ^ > «>^ t 、 ► 睿 詹 >i 

重及一疋的丄艺余忏卜，具膨胀符彺钣贫金成 :分肌 佛疋.获因呆 

课题组 （1975 年）的研究任务就 是：确 定合适的合金成分，使得钴 
的用量尽量少，但使得合金的膨胀系数与瓷封材料的膨胀系数相 

/ -A*, c c _ o a -V iVH M 1 r\ — 6 /°r> \ 

、狂山 \j 心 I 口 j ，平 m :丄 u / w . 

这就是一个控制问题，首先要建立回归关系式•.设铜的百分含 

I • 

_ 售 、丨 .#_ # ^ t A . _ — w 1 % f a . a \ ■ • v • #- f __^_ P ■ ■ * # X A •嘛 、 • v ■ _* 

，重方；锞的臼分百重顾云工2,領的日分甘重艿 工 3,记 

〜 ^ ^ Qnn °P V , ^ nr \ °P nrf ^^66 B ^ BES*fr 亡独且 〜个， 

U300 > U500 厂 4 u w 〜/ 入 yJ\J\J h j 口 疋 MV 刁 S y^K 赘 Cj II J 於卜把 乂 1 9 ^2 9 乂 3 

的函数，考虑到各种误差因素，设 

〜 **v» 、 ■ 1 a 

U300 — J 1 V^-l 9-^2 ，乂 3 / I Cl 
O ：500 = f 2 (工 1 ，工 2 ，工 3 ) H ~£2 

G 能枏港^鹼齡坦土; fiife 由 f , •知进县速古钇脍 A 才田乇姥 

彳 、 rati ii^- 4/va »yvj /v*— j i "i ri j ^ 7 uii ^jyu _ll* h • ¥~^* y ^ 

性函数明显不符合要求，所以设想用三元二次多项式模型 
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/(^i ，工 2 ) —b Q +61 j：i + 6 2 x 2 + 心工 3 + 

b 4 x\ + 65 ^ 1 X 2 + 6 6 :ci ： c 3 + 

67^2 + 6 8 工 2 工 3 ~^b 9 xl 

: 、 1 

% * * 

\t . j I _ - ‘ • ： 、 t ^ tort lip * > i ■_ _ a 1 r ■ ■ n * * I . \ - I •、• 

万 J 俩疋示双％，&，…，仏，谈诛题组烁 J 21^钢钲60妒，兵名乂 

〆 .，■ (" 1 3 ’ ^ ' 

成分 如卡 ： ' 

铜/% 0.5 1.5 3 5 7 

» 

镍/% 32 34 35. 5 37 

钴/% 4 6 8 

全部组合为 5 X 4 X 3 = 60 种！各炉的实际成分及膨胀系数见 

志 S 9 

^ ^ • 

;， 会全试故 SfriSf 额4、 

v • • 1—1 jo. n**v，n ma. <vn \ hk yj / 


编号 


铜 


镍 (％) 


钴⑻ 


CT 300 


CT 500 


( 10 — 6 ) 


nn 


32. 09 


3. 72 


5.76 


10.44 


• 50 


3L66 


5.38 


4. 12 


.51 


3L64 


7. 26 


3.02 


58 


36.80 


3.59 


7.49 


.11 


59 


• 10 


36. 39 


. 02 


7.93 


84 


fin 


7Q 


QQ 


R Q.R 


根据这 60 组数据用最小二乘法估得回归系数如下 


1關 ― * 


0300 



0. 35 一 1. 46 


G 500 


17 4^1 — 0 fidl —1 -RRI —1 fiOln 

f • 4i - --- - - - - - - - _______ 


HBH—B 

■WnBiHi 


. 089 0. 074 0. 050 0. 193 10. 110 


nfi7ln nfid 0 OFiQ 0. \ ?A lo. 0 B 9 


可以计算出 a 3 。。 的回归残差平方和 Q =12. 12 ， J =0. 4 9; 仍 。。的回归 
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谜装軍 Afi 17 : 诗 ife 木 rniift 七班拥 县見基 的 "SriM 

/ 八 >cn I j-4 f \n ^oc ▲ •• 丨 v /，\j 、 vr•. 丄 ，， aa n i 卜 *h i 'ioiT^ r hk . 句 h 义 ？ .m k^s 

用来进行控制.问题为要求 、 . , 

c r〆^ .. ^ o r\ 

o. o^a^o^o. \j 

5. 5< o ^ rtn <8. 0 

- ■ W W W 

^ 、 - # - # t • * * * > ■ .# / w 、 _ ▲ * * - t 鬱 J # t . I * ■■* 、 _ 

I 口 J A ， : r 2 ， :c 3 应在忭么范围（这个范围杯方瓮封凶）？ ， 

u 卜春沐木 餅 困慕出 n 木一价曲而因诸的 /Bcbqp 曲而 

I^Ui-L-，W y I fU» M^l >Cr M4 / u I V/V m Md l»M 4 MM 1114 

较难研究，故从实用角度看可利用切片法（即固定 = 个自变量，考 

由 O 7 H ? 人 di TfF ： 且 -V iVn r 44 t 44 ^斗方、祕山次土本 P ^ AA * 人曲抑立 17 八 Bn 
來刀 pa I t = i 又里 心 1 口 jpiy pu 钱穴尔人瓦太 、 j m — j ^ ^42 m > 7 J ^ 

可.根据以往的经验和节省钴的原则，选择锆在5%到6%之间, 
固定钴含量5%、5. 5%、6%，分别找出铜与镍的关系，最后得到 

铁 I 報 L 镗命 抢制弇下利萡闱由 . 

丨 " ' n v ' ，’“ i—I ，蛘 I ■鏵 ♦ < 

5%<钴<6%，3,，5%<铜<4. 5% 
45%<铜+镜+钴<46. 5% 


v 4 . _ k • •私 >—» i"t 罾 蠡 身 n I - 丨 磨 # i _ 、廬 # ^ * 、詹、 g ^ - _ ■ j t ■■■ ^ 丨一 t * # t *. _ 秦 %> ■ m 

这就是该诛题組得别的结论.在上还范围内取足成分，进仃救址 

社胳制浩 m 的各合*士树66齡此 M ： 热施免各正亜古 

J IM-J Ati U-l MV R JOZ. 'KJ m MV | 丄 MD 仰 R 4 ->^ 9 1^1 HU /Li H^i -I 少 ■ 

究任务. 

/ rm \ r=i ih 4 tt an 士 M% 加 ^n. 4 ^ nA. 

v » ; rayzi 供 sht rrjiBMK 性 9 a 

现在来研究本节开头提出的问题 （1)， 即如何根据数据 （5. 1) 

山 Klrt-* ✓ f— 广 k 、 . f - ry >/» L*-» _TT^ J. L > - »- I—t t*Am 1 It* r* ■- • ■ _ j 1 1 、- 上 L f—# >t — » > - -^*1 1 ✓ F— 、 

刊断 U. Z) 甲嗯仉项 e 的万茇疋膠小 m 侍所浬 2 ： 的凹 w 万往 u •以 
县倉音 V 的汶铺 : 县班烚鹼下 别砝份 

I - 一 U*、M V • W ^U I / ,一 IL^V 

t 

v H 0 ••隹 1^2 = ••… fppzQ (5. 12) 

、 • ,4 

^ ^口 iEia, 匚 1 irfr4^44i 染 H 油本 fiCz^TV iVi r?n Itl-fcrffl / C 。、且古 
— j=± iix k>cvo. 丄厶 ji j 挪 i/vyy "! 比儿口 yi^tjM 夕 山 oy te;-r 

意义的或者说方程 （5. 3) 是显著的.这时就可利用 （5. 3) 进行预测 

_ 1 、 Dj M*il 

现促市 L 

右时坏萆刦則萁个白亦骨成葚胜白亦骨对 V I 否右®垄影 

V ， • - ， I - — X *<# ， ♦ 嘁，_， V f -I 一一 • ， ■ ， _ f - t ■ h ，- W ^ ^ - ■ ， -mw ^ - «— « 

响，这个化为检验某个或某些回归系数为零.即检验下列假设 

T-J. \ O, -=-= O O. CS ( 1 Q ^ 

i 乂 0 : fji 2 fji s v V^. Mxjy 

(这里 s 是固定的， KsShKAC … <«/>). 
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低份 n 都县下万 ii -^船 維杜厢份的條姓褚取 

l|>v ^v- 、'^ * — — X - I n V v * -■ v X Hr >A4_ I ， '~9 /4z»v 0*v I— ■- 11^ K» V 1 M "、、I F9 / 〆 


H 0: Hj 3=0, ( h . 14) 

^ m nr 且 o\/, 人丄 i 、 mrtt ： 

Jk2,i±i “ 也。 / 、、 〆 I 丄 / 疋叶，订 ，| J 5yQT 工几入 • 

我们先对假设 （5. 14) 给出检验方法，然后分别用到假设 

/>r 1 o \ 土 rt / r 1 o \ L_ * 4 - 

^0. 丄厶 J/TMV0. 丄 0J— 

我们在“假宙 B ” 下讲行讨论，即我们偁宙 

， ^ ， ■ I ^ V 1 ^ w V ■■令，_^聲 ， 


y 产 fio +/?i 工 t i + … 、七 +G (z_ = 1 ， … ， n ) ， (5. 15) 

其中 A ，…，相互独立同分布，共同分布是 N (0,( t 2 )(<7 未知）. 

!沿用前面的记号 .如啖 =(£：，(：). 

记 ^ ， 


W ={^& R n ^= XB.S G R ^ l \ 

、 ~V ，■- » ~V J 一 ，厂 ，■- , 

w 0 ={$e R n ：^ = o , 

e = Pm ; V ± = Pm ; V 

W 一 A X w j -L 9 ^0 一 ▲IV^J 乂 

， w 0 

Rllrti^Xffl A 1 

州阳此社 u /^M </L H 里 


F = 


||-| o || 2 /( / >+1- q ) 


• * ▲ O / ^ V 

Y -^ V / in - p - l ) 


(5 - 16) 


ifc W "tr HR Li EY 厶 -Ul — n 奶 _ 厶 _1 、瓜女甘 cb h W 66 她翁 

^ i 丨 0 I /J 氏 "、丄 \ y i 4y j- / yJ n\4 y H 〜 WJ 0 ^fn j 

易见 — 故 H 0 下 •、 


F = 



〜 FCs，/! — p — 1) 


下面我们来求 « y — 1。« 2 与 ill — 1。« 2 的计算 公式. | y - lll 2 就是最 

*fv ―- i-X* )丄 AA Tits. \Jt —^Crt tirt / iTt / HK. rr \ \ 

/J 、 一米泊 TTW 双发 T 刀 W ， PtU 兄 VO: t )^\,) 


p 


A 

Y-e 


Q= l V y— y] liJ 


我们再来证明 


U ~ lo \\ 2 =^ H / iH ( x / xr l H f y i h ^ 

事实上，若记|。=冲€\^。，则&是约束/^ = 0下的最小二乘估 
计，由定理 3.6 知有 尺使 " 
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但 


(Y f YQ— = Y f V 

户 A /V 丄 

\Hp =0 


X f XB = X f Y 

r 

、 

A A^—^) = ti X 

. 0—0= ( Y’Y、一1 U f \ 

fj jj y 

两边都左乘 H， 由 Hfi =0 得 

t tX t t / xW \ 一 A r r/ % 

—tip = « VA A ； n A 

3 =— r U ( Y’Y、— 1 wH— 1 uh 

i\ iA 」 M. MLJ 


所以 


e-^o 


2 


_ II ^rr\ \rrx II 夕） 

=w，|_ 

^rR — R \ r X f ylR^RS ' 

' ， • • • • ' X 

〜 A ，―， ' . .… 

= {p-pyH r X * 

— p AX /K 

> 

^^H.T H{X f X )- 1 H f r i HB 

# ― - « 


inrt it. ?*a n \ t r=« >t 

闷恥饭狸的犹 TT 貫刀 


F 


W 「 U(Y f Y^~ l W W/3/c 

± m L -1 -i \ 乂 1 」 M. XLjf %J 


p 


\lyy — / (^ — p — 1) 


( 5 . 17 ) 


, . V • 扈尹丄 ' • + I - ' 

在 H。 下 F 服从 >&，《—/>—1) 备 i，; 给定硷验水平、后査相应自 


由度的 F 分布表，得上侧 a 分位点(即 l_a 分位数） c， 可得检验 
H 0 的否定域为 



{F>c} 


现在把上述一般方法用到假设 t5. 12) 的检验上去，此时 



这时直接可以看出 
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U — liy 吾 i = 、 ly y — Q (5.18) 

1=1 1 、卜 ' - - V 

称 LT 为回归平方和，在 k 中 V 占的比例大才说明各自变量 A ，…， 

nr . 的 ? yj ^ S ^ f ' Si Dial ^^4:4*暑 

w p I g -t=^ -^v" • I j • w J t 一 < 

^' *、*.f 

r = - Mlii - ( F , iq 、 

A Q/(n-p-l) - 

. 1 ' • ^ 

女 t 7 "C BB Li EY 表 ^― i 、>4 V 允 IT ^frr fHI itl 66 17 姑 ■? 丰县本 

i a 0 I /JPt /TV ± \ y ^ n y 丄 / 刀，眉卩赘 H 、 ± yv ^ ^—» MV ^ <^U v I 

F 分布上侧《分位点（即1_«分位数众可_检验&。的否定域 

/. IT \^\ ^ 1 .' 

t 

考察回归自变量对因变量的解释能力_可用 （5. 19) 的回归 F 

rfrmi+t I m 口仁■:田“贫切斗方撕 ” D 廿 <ir vV 來 

57 L H M .7 V ，此 币币 / T 3 /^l m 叉 TH ^ C 尔取八 

' r- * * - i * t、， f . - 

frT ‘ 

•• R —妒 (5.20) 

这样 

p = _ 、-_ 尺 V 户 - 

_ ^ 4 O v 1 y ^ ^ 

Kl ~ K ： J / i , nyp - i ) —、 

R 2 是回归平方和 17 在总平方和中占的比例大小.还可以证明 
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W 复相关系数是观测数据 、， : y: 


y n 与回归拟合值 > 1 vy 2 ，' 


#!• * 


w 


^ 之间的样本相关系数的绝对值 . 友越大 就说明•回归方程越精 


iJft 曰 m 二 Itf d-i* r> 油曰 “ ..... 

m* 勿凡 — -c\ 肌疋： yi ，夕 2 ， ••• ，： y” 3 

样本相关系数的绝对值. < 


9 J 0 \t 之间的 


-wn - ■ /, ■ » -i^ ^±a. /m、n / r- -• r\ x 八 jL*+* —o- t»v _ *• d" JuL 入 —r*r 

现仕术丐烬煆 BCO . l ^；- 宂有一 T 符杯谓形：彳 = i . 即毕 T 承 


数士 0 的低份 

W"v ， *v ▼ r-f ^ ii^v 


H 0 : / 3 k = 0 (A 是固 定的 . 


此时 H = < 0 ,… ， 0 , 1 ， 0 … 0 ) ( 1 是第 A 屮 1 个分量 

的第灸行第兔.列元素為设则 


jfH ' amtxr 1 ffr 1 Hfl = qi k ) 2 /e 


干甚 


F = 


t ▲ 

( a ) 




广 I ； 91 、 


在仏下 f 服从 Fa ，《_/>— l ) 分布，给定检验水平 a 后査出相应 
F 分布的上侧《分位点（即 1— a 分位数) c 可得检验 H 。 的否定域 

‘ b . v ▲ ▲ k v A •■血 ^ . V m — -■- 鳥 i 烏 • ▲ > - w M 

为否足 ff Q 则说明变量 ^ 对变量 y 有显署的影哬.这个 


假设也常用 £ 分布来检验 • 

当假设 ( 5 . 13 ) 中的 5 > 1 时使用统计量 F 的表达式 < 5 . 17 ) 反 


而不方便 . 直接使用 （ 5 . 16 ) 更好些.这时 


\ 


F= 


(Q 0 —Q)/s 
Q/ irv^p—l) 


( 5 . 22 ) 


其中 c ^ = | Y - 岛 || 2 , Q =[| y — 冽 2 ,0是残差平方和，<3。也是一种 

“成必市士：!^!，，白 ca ^： 且 v 以占 tAc 旦/ „ \ ( 

双左丁刀 TW 幻口书疋四 艾里 J >VJ 曰 > 里 \a^ ， •- • ，工户 / — \x ti , ••- , 


工 ;}的回归问题相应的残差平方勒.这样分别计算出 O 和0。后 F 

• S r r r ^ w ▼- m m w r r ■'w r r ， r ^ w w w 丨 W ^ w n ^v w ， ▼ ■ 


it- A-*- 丄 |、_ >?" K =3 jTt^ -wr*t —^ 、 _k^ L\A rt t — -t* » v f、nJW A» 、 I ， r*/ ， r 上 L 、 、，• 

eym 规:恨芴侍到 j •这忤诹円以班兕 rr 昇圯晔 a a mm . 

假 n 12 ) " F ".+ 暑 F ^ PV <. n — y > + 1 V 始* 由給 ^ 永 

卜 IL^ 'V ， ^ w x I 7 尸 % *,• 一 |^| 'V-IX ： , J 、 i 

a. 设 c 是 F(s，>z —/>+ l) 的 l—o ： • 分位数 . 则假设 （ 5 . 13 ) 的否定域 

且/]?、^\ ' 

ACr I 乂 〆 ^ I J 、 - 


例 5 . 3 表 5 . 3 中 ^ 为以 1948 年不变价格计算的英国进口 
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商旦知苗么的崧激 r.i ^ bl)i IQAft 生你故斗苗的龙闲焓声旦的指 

r^j mm r \ « 刀 mv jpi jvv 7 … i /v I i/i I m ^ I ' ^rr* vi v 1=1 / ' mm mv 

数， a 为进口商品与普通、英国产品价格指数的比. 

斗牲但 

M 开 1 寸 、 


n ^ Q * AI. ^ 1 H R 9 - ^ nr ., = 1 01 7 - nr\^ == Q 

，灸 v j / ^ V f \y vy m 9 / j i J 丄 v 丄 I , /- 」 j 乙 v v * 

• ■ ** v • 

5=116. : 9, 王 • i = 113 ， x . 2 = 106 

S ^ = 124 228， 2^=115 571， So ：? 2 = 101 772 

v 八 V 

一， r • 

I 

S Y,xn =119 750 ， S v,-r^ = 113 433 ， Z)m，= 10,7 690 

^ 、一一 .^m ， V 

, ♦ 


表 S .3 英届进口数据 


年 

、y 

' :知 ； ' ' 

< Xz 

1948 

100 

100 

100 

1949 

106 , 

104 

99 

1950 

107 

106 

110 

1951 

4 120 

1 

* 

t 

111 

* 

$ 

126 

^ ^m. 

iyw 

， no . 

» 

in 

_ 

1U 

» 

- 1953 

116 

115 

103 

1954 、 

1 O 丫 

丄乙 r 

'* A i on k 

LLi\J 

^ 102 

1955 

133 

/ * - 1 

1 # 24 ^ 

103 

^ 1956 

f r * 

137 

126 

98 


* i 

♦ 

■ * 

卞是 






L 




i 


11 9 


ft7A \ 


112 648 


L 




921 


▲ 

/ /!5 v 


PI 


L~ l L 


丄 364 23、 


0. 113 88 


a ▲ ▲ 

r\ — 八 —r— . j /"\ r\ c\ r\ rr 

.灼 = yu.i — Pzoc.2 =—4y.vy r 


y ^- i 9. 329 7 + 1. 364 2:^+0. 113 9 x 2 

被魅采古主 rurmiti 3 E 士主 m b 成兰 3 E 士知乂 VfiiMb 

/irr '1 丁 I h \ i^-i y-A I MMy J | JJ f \ f* J*4 JJ，4 

« « 

t ( U ~^ L xy =1 183 i 34 
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U = Eyi ~ 



~TT=77 H 


检验假设 H 。 :爲 = p 2 =0 的统计量 


P = 


U /2 

Q / C 9-2-1) 


= 45. 76 


i 


而 F (2,6) 分布的 0. 99 分位数(上侧 0. 01 分位点）才为 10. 925,所 
以回归方程是显著的. 


检验假设 H 。 :你=0的统计量 


77 


1. 364 2 


11 


Q / C 9-2-1) (0.001 586)(77. 55)/6 


90. 8 


. ^ 

^ / 1 n \ 人占山 rtP 从 T7 八 士 i^Ai r\ no 八 / L* Vblir r\ 八 i \TT 八 

iiu v 丄， u 厂 I y m ; 叉 trj r rrj u. ”” 丄 twj u 丄 

点）才为 13. 7,所以庠不为零， A 对^有显著影响. 

丄人 ■=* 入 /M-t .、rt "r -r A A 上 t /-i- 、 r 


4 ^ iiA. /ta^rL r t rs 八上 / 士 、 I 曰 

恨题 IK 议 n 0 : 你的现 TT 里 


F 


r u 


0. n .^ RR 2 

<w V 


Z 22 0/(9-2- l ) (0. 00159)(77. 55)/6 


0. 63 


这个 F 值小于 （1，6) 自由度的 F 分布的 0. 95 分位数（上侧 0. 05 

4 

水平分位点 ）5. 99,所以 F 不显著，不能拒绝 H 0 , x 2 对 3 ；影响不 
大.因此我们把变量 x 2 丢掉，建立: y 与&的新的回归 方程： 

3^= —35. 09 + 1. 345 xi 


其 F 统计量为 


>k 


§]My 


Jk 


(lyy — U )/ (9 — 2 ) 


Qfi ACi 


而 F ( l ，7) 分布的 0 . 99 分位数(上侧 0 . 01 水平分位点）才为 12. 2 
所以回归式仍是显著的. 


Ail ^ /i / f-U. -rnt -ifr -Mr oni 
m i 4 ♦、土牲下伴佚坐 


、l • ^ f I 人 . o a *lv ri—P >lt /*A* il« 

乂 / j m 疋 — 「八住厶兮 /j 、 卩 、 j n trj 土 


理节律（例如血压（收缩压或舒张压）如何随时间而变化） ，一 胜学 

w w p ^ - - —r -- - — r ^ ^ w - ^ r -- -- ^ -- 丨 ▼ — ^ w -w ^ 

-LM , I • ■ 少 — r"* *T"%t -n*it 

百怩 mj r 列悮型 


f(t、= A/f-4-Aros^#i/-|-<i > ) • 

, — - a • «w ^ ， a , / , 

其中 M 是基准值， A 是振幅彳是相位， o > 是角频率，例如 0) = 360/ 

9A /YA 县 ’ 阳戈 J 、、 的生補佑说县 .~? 分右视働 I 估、 ,.= /Yf. 、 -ke. 

—I* J w ,"I /、，LJ MV —I— J 口 KJ» • l"J AQOi rj /vu IA'4 |_ti j J Wj / * 

()=1，2，〜，^1)，这里~是第 j 个观测时刻， ei ，…，是相互独立 
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同 斗 龙的随* M . A .<&? (dC 

_, J /V H v 1/ U^J^\ T WJ 羼 ， V V 7 V / W Z|、/'HI / 7 ^r» j”J 11^1 W | 7 ^ ^ 7 i • \ v 


參 <360。）. 


解易知 


yj = M+Acos 彡 • cos wtj — Asin 彡 • sin cotj +e> 


COS (ot^ 9 


dhfir A . -r— Jlyf-L. -L. J • f : 

队 yj _ … r pjLj I r‘j t \j 

这里 Xi =COS (oti < 

J ^ 

j 3 = Acos ♦ ， 

这便化成了二元线性回归樽型. 


参参参 


■_办 1 

ri / 


= sin coti ， 
— Asin 爹 


(5. 23) 


我们可利用方程 （5. 6) 求出的最小二乘估计 0， y . 
易知 ^ 


V r ^. 

/ A 




2—> — i)2 


:: 〉： (^J — x) (Zj —z) , [x 


鼇 ， 


y >,)- 


n 


/ 


Kx } — x) Ky^ 


n 


n 


E 


yi I . 

^ ^ f 


L 2 y 




zj^yj — yj 


解方程 (3. 6) 得 


^_hllly 一 luhy 二 

卜 Z ” Z ”一 Z ?, ， 7 


― ^12 l\y H~ iwlly 
1 11 ^22^ 一 ^12 


M 


\ 

A _ A 

h 


A A 


从 （5. 23) 可得到 A 和 # 的估计 A ，多: 


A 

A =^/0) 2 ^( y ) 2 卜11/=二|) 


X, 


LJ 

^bu — e /. 


奸180。， 
180? — 0 ， 


^>0 9 /<0 

» 

^<0, y ^0 

$<0， f <0. 
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▲ 


其中 ^= arctan ( 


y 

—x — 


) (0<没<90。) 

/ 


于是有非线性回归模型 


a 

y = Af-hAcos(cot~h^) 


( 5 . 24) 


、rV 人 B TIT -Ar* )/ n 口 n TB? 古人 -U= A 曰 r\ 、rV 地 / 人 T* TtA. 

込 / 「刀饪 ： jeiir 句人夕匕,^ 定 力込野丁饱题 

\ 11 m 

Hn lB = Y =0. 使用统计量 

w —' a ， 琴 r - ▼ 


F 


U/2 


Q/(n— 3 ) 


(参看 （5. 19)) 


在 H 。 下 F 〜 F (2 ，w —3) ，给定0?6(0，1)，设卩(2,77 — 3)的 1 —a 分 

位数是 A ， 则轧的否定域是 {F>A}. 当 H 。 被拒绝时，所得到的回 
归方程 （5. 24) 是有意义的.在计算 F 时，注意 U=L ly ^l 2 y y\Q^ 


n 


^ 人、 -??£ 




%这里心= —yy • 

fc ^ ' 


t 

t 


在实际工作中，通常观测时刻是等间 隔的岣 


j 一 1 

n 


(j = U 


2 ,…， n ) 且⑴=360°(最常见的情浼是 w = 12 或0)，这时上面的计 


n 


n 


n 


算公式均大为简单/实际土, ; S 咖一产 0 ; 2>, 


n 


n 


n 


n 


2 sln wt j = 0 ， XjZj =f ^] ( cos (of:j ) sin (Dtj = 0 ® ^ ^ x ) 


①利用公式 


sin 


cos kd = 


料+)卜 sin (卜 +) 0 


(当分母不是 o ) 


2sin 


知道 


- n— 1 ■ 

) ]cos kd = 

jfe = 0 


f\ / 

2sin 孚 cos i 


■ % r m 

iJU 


2 


2 sin. 


故 


360° 


时， 5] cos kd =0 (n ^ 2) 


同理知 


r«- a r» i 

^ sin kd = 0 9 2 cos 姑 • sin 妨 = 0 


k 


jfe = 0 
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y ：( 
% 

k = 0 v 


I XX r% 
I 


OLn 


\ 

) 


71 

r\ 

L 



\ 



同理 


于是 

量 F 为 


n 


n 




yj 





^jyj 


统计 


r n(A) 2 /2 

H = - ： - 

x Q / ( w _ 3) 


这里 (i) 2 = G> 2 + (：P) 2 ，Q=-L— w (A) 2 . 这些都是便于应用的简 

单公式。 ' 

* 

(五）回归模型的残差分析 

* 

^ - \ t. 、 A i 1 • IjI>* I / »f I 、 rt LA. -r* A / > - _Le^ 广 ■■ 舍 • I—^ - 上 L I — f ■ 1 1% . |-_A. -rt A. 

仕订化凹归俟型的假仗恆軀 cm 估凹 iti 万荏的 显者饪 恆狸和 

回归系数的裣验)时，我们有一个 前提: “假定 B” 成立.即假定模型 

(5. 15) 的随机项~，…，6相互独立同分布，共同分布是 mo ， ff 2 ) 

- 1 、 , ■ 

^一土如、 /e 任伞 iiiJii: 士水 “他由 d ” 且 术 tV … 

\u /^H / . i^l^r 7^M77 p 4 Jki I ItXAC. 口 ； J 人 JZ-: 

这是回归分析研究'中很重要的问题.现在介绍简单的处理 

* • 螫 

-4-t ^-1* 

刃、広. 


根据数据 (5. 1> ，我们可得回归方程 

: y = So + i § iJ：iH - 1 ^ Pp x p 

. == /?« -1— /?, T ., —\— • • • —\— R . 下 .. 
x jr i 1 p 丄 丄 _ 1 t^p 一 1 P 

e { = yi~yi (z. = l ， 2 ， … ， w) 

分 itk 二 mlAfr 成去 ^zi 2 ——/二 …：、 ’ 

込三 c：, 佩双左 . ^ t — wi ， … jt： n y 

则 e = Y - X 8 = Y - X ( X f X )- l X f Y = U ~ P ) Y 9 

r * I 

rrt r% 了 t t f t 严 、— 1 ， *y/ t trA /_!_* 、PI ^ r% 上 ii* A*A* * Z — * A* A . • -r%l — * 

达里 r = A(,A a ； a 定早 m 件. 议矩件 r mm i 仃弟： 列兀 

% 

麦 ^ bh .. 削女“偏帘 R ” T ： :服 U W 维 TP 本从亦 I 曰 

^ V JT u • i-j— il>^ /\w I ^ v ， * ^i-l* <ui 、 畢 P t j_l. 

Covie f e ) = a 2 ( I — P ) 


令 


Eei = 0 ， 
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7,= ^ - (z = l ， …， w ) (5. 25) 

这些 y , 叫做学生化残差.数学上可以证明（参看韦傅成等人的专 
著 [15]), 在“假定下，只要 ； z 相当大 , 7l ，…，％近似地相互独立 
同分布，且 K 近似戚从标准正态分布. 

由吐知彳首.加果“假宙成立 . 72 又比銥女.咖 y , ..-. r - 由女 

，■響 ,，，,，,丨 ▼ - ~ J ^ ，-- ^ ^ 〆 " 、,， ▼号 ，丄, ，丨 ，‘ I ^ ^ 

约有 [0. 95 rz ] 个 h 满足 I h I <2. 若根据实际数据 （5. 1) 算出的 
…， h 中有较多的 h 不满足这个不等式，则应拒绝“假定 B ”. 
当 n 较大且不能拒绝“假定时，一般应承认“假定 B ”. 当; z 不太 
大时还应考察“残差图”，详细讨论见 [15]. 

当“假定 B ” 被拒绝时，往下怎么办？这时应对数据点 
( x n ， …， :^，： y ,) 进行过细的研究，要剔除“异常点”，这些属于回归 
诊断的内容，见 [15]. 

f 

^ a . _ w ft 獻麝 . 、 - 丨 __^ * —一^ w . ■ w • .丨 * ft ^ t 、 w 

C 5. Z 5) 甲的九应如何计昇呢？ oj 以址明卜列公式 成立： 

pu = — + (x (0 — 王 ) ’L 一 1 (x(° — x) 
n 

其中 




以上就是对回归模型进行残差分析，用以判别“假定 B ” 是否 
成立（当然，残差分析还有许多别的用处）.为了显示这种分析的必 

要件，我们搵出 T 列例子. 

例 5. 5设有下列两组 数据： 

第1组 


山 1 

1 

± 

0 0 

U kJ 

4 

\J 

a 

\j 

7 

i 

Q 

u 

« • 

z. U 

1 

H \ 

U. b 1- U 

k 

_ 

6. i> 

r 

z. u 

4. 5 

V 

b. U 

6. t) 


第2组 


oo x 

v . 

1 

2 

3 

4 5 6 7 8 

• . , 

m 

Z t 

* i 

0. 5 

1.0 

2., 5 

4 

* 1 

2. 0 5. 5 3. 0 3. 5 4. 0 

* * 


今对这两组数据分别建立一元线性回归方程.经过简单的计算知 


= 42, y ] y { = y ] z t = 22,^ y ] = =79, 


= 120 . 由此知这两个组对应的回归方程是一样的， 

1 

3 ^ = 0. 5 + 0. z = 0. 5 + 0. 5x 

( 

而且第 1 组对应的统计量 F 1 =6 l ^- = 7. 875((7, 是第 f 组数据对 

Wl 

» 4. 

^ f # . fe # b .冒产 \ . ^ ^ » % U i - > ^t># t ■ 1 ^ 1 #- 倉 t^i V > . . \ . . - V 蠡 _ P I 

® 的凹妇千万祁， y t 是弟 z 组数据对应的残差干万祁），弟 z 组对 

应的统计量 F 2 =6 ^- = 7. 875 = F !. 从而两个回归方程都在检验 

W2 

水平 a = 0. 05 上是 “ 显著的 ” （ F 分布相应的临界值是 A = 5. 99< 
7. 875) . 这样看来，似乎同一个回归方程拟合两组数据都是合适 

的 . 茸銮不棘 . 我们夹看砉客细数抿散占图（图 13 县第 1 组对应 

，- ▼ -% ^ ， ■ ，，广 ■一 W ， > 1 t f — » ^ 纊 , ，、 ，■ _ • ' _ ■ _ — 一 ，， — , _ ^ ，一 


的散点图，图 14 是第 2 组对应的散点图）. 
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图 13 


r 


图14 


1 1 古 Tim U IT ^ lLi 地 1 厶口 从 -fcR* Jr 廿 -4t- U 去 古 似 2d 地 
/ yv 且肌丄 ，1、入由泪 UQ ，乐丄 一 且狄卩口 J 4 L ，所 

2组的数据点中有一个点 （5,5. 5) 十分特别，很难谥它和其他的点 

^ 严 T W V ▼▼ * ， v_v W W W — ▼ ■零 ■- 罾 -^― - w "W » ▼ 

在一直线附近.为确切起见，我们利用公式 (5. 25)_(5. 26) 计算各 

细粉抿射命的受出仆雜荖.钴里加下. 

•a^k 必卜 4 ，-一 /-LdL« "V — m - I U / r 1 7 / I 、 >/^r» I • 




从这张表看出，第 1 钼对应的所有 y , 均满足 ly , l <2, 故可认 

* ， ，， ▼ ，_ W W • • * w ^ B ~ _ - ▼ 『— r v w ^ ■^r * V 1 » 罗 ▼一 ■— 

为“假定 B ” 成立，因而对这个组的回归方程的显著性检验是有效 
的(《==0. 05) .对于第2组来说，有 K 满足 | y , |>2 彳因而 .不能认为 

“假定 B ” 成立，对回归方程所做的显著性检验无效.总之，用回归 

* 

方程 S = 0.5 + 0. 5^拟合第1组数据是有理由的，可用来进行预 
测或控制；用回归方程 z = 0. 5,+ 0.'5 x 拟合第？组数据缺乏根据， 
不能用来进行预测或控制. 

f 六）笛二维间归箱介 

\ ^ ^ / ^1，— ^ _―V ^ « 

设: y 与 A ， J ：2 ，…， A 都是随机变量，要找/(^!，: C 2 ，…，:^^使 
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PT「v — f ( ^ ir n $ll /l\ - -l^ir "&笛 ~\ 不 : rol Ift iW PEI 

—l_^7 j 、一丄 7… 厶 7 ，一 p ,」 -*-t^ r 4 ' y r 4yu a*^ - —- /、 »—• y — * m v i v • 

可以证明，只要£：/有限，取 

'r\( nr nr _ • « • \ = tf’ ( n t nn nr^ m m m 卞 * 、 

/ <P 、 山 1 f^z 9 ，山 p / ^\y ^ 1 9^2 9 9^p y 

则对于一切 /( A ，《 r 2 ，… ， Xp ) 有 

rrr _ f — 一 … „ \ 12 rrr _ r/ „ „ …一 \ 12 

^-Ly 丄 l ，丄 2 ， •” ，丄夕/」 — j 、 xi ， X 2 ， •• •，丄户/」 

I 

这个 p 叫做回归函数，它一般不易求出，因此只好缩小函数类，限 
定/是线性函数，只要找戽 ，/? i ，…， ft 使得 E[y — (沐 -hfisci +…4 

S . x .) l 2 扶到最 A . 

| — 尸 p ^ j ， - 

记 





( N 

OOl 

l^= 

A 

• 

• 

• 

， x= 

工 2 

# 

# 

• 


3 办 

'I 丨 . ^ 


x h 

、 r ， 


R X x = Cov (X 9 X ) ， 


则拟合误差的期望值 


R xy =E[(X—EX) iy~Ey)~\ 


✓"V / A 八、 T ， ✓ A 、 9 

， jd) = tAy—ldo — jJ 入广 

= El(y-Ey)-pfdX-EX)-\-Ey-(i^-\-^EX)J 
= E ( y - Ey ) 2 - h ^ R xx / 3 - 2 ^ R xy - hb 2 
其中 b = Ey ~(/ 3 o - h ^ EX ). Q ( 爲 ，沒) 的最小值在戽 j 处 S 到，爲， /) 
满足 


^xxP~^xy 

/So = Ey—^EX 

L* J—T nl — r\ I c\ mil 

手大丄 “ 匚 p—p^rojm 

QiB^B)^Eiv-EvY J rE[R„3-2E[R,. 

~ ■ i ^ ^ § 和 j 

_ x 9 I / 文 I w f r\ ✓ 文 ■ 八 / 文 I x / 

=t.Ky — t.y^^rd) K xy K^6) — Z^^r6) K xy 

=^K(^—R^ 2 -\-^R R — 9/YP +〆 ?？ ^4 - 

— V J *—■ ^7 X ■ p •售 IX^ —^ m 1 \x * » XX v ， 

2d / (R xx ^—R xy ) 

、厂广、,— _|_ 夕 p Q—9^1? 

I [j 八 xxp up 八工 y 

= Q0o 9^y 
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—t—I T- - u M . ^ I -4 7 

卜 FR : jR iy 
^o ~ Ey^.^fEX 

这是理论上模型拟合的参数，但实际应用时只能得到如 （5. 1) 那样 

AA 40 -rta ，人 t ‘ AA* n 卜一 n -+- A*r» 门 1-U )丄 八 ! 

wr 似俯，牲化工奶 u 不沖 , KBBiflyn "r ? 



L X y = Hiy ) pXl 

田 F 知『 你士 P *1 T? 66>fdb-J+ ±tm^r^ 1166 前 A A^JSiU^^M ： 

f \4 ^ ^i h xy I r* y^j ^ v xx f \ h ：ry m ^ im y I ， y i Iix ac^ v ^ • 丄 /n：^ 卩 y \ / ’4 o<i ■丄 

无关，则得 沐， 卢的估计为 

▲ -i 

r\ T —1 T 

— a = l . 


▲ _ ▲ _ ▲ _ 

po = 孑一 ft 王 .i —… _ 


， x fi 的联合分布是多元 


痒与弟一突凹 jw 的 tr 昇公瓦元■: 和冋. ; 

笛一米问归由加里個由亦昼 _..n 的庇各从龙县金 i 

4 V * H— I I | >AI1 J =F\ 7 y J ^ p T/、（_| ^ M 

正态分布，那么可以证明条件期望 Ebln ，… ，: T ,) 必为 

一 •― — hhiAM-7^^t m lib 分 “且讲 ra it! ” ， 1 、又也曰 44i 抓 it! 山 

丄 2 ， -” ，丄户 oy ^ mvu\^AV-\ % 、疋疋 tt 叫 m 


x% 


，工，的 


^KTjr 


于正态分布在实际工作中大量出现，所以线性回归在实际工作中 

-/ • t - ."Vt^ JLA* •■ 、 * 111 

仴 J iZH^M 用. 


f - h ) 婪子回归分析的几占沣啬塞顶 

\ / • • ■ ， — v ，_ ■，国 n _ ▼ 琴,••零-^ 4 ，， 

(1) 对实际问题，要根据问题的物理背景适当地选择摸型. 

女右此 iWfficb P 古命劫■的細办沐怒腺 . Vm 下商的佃 I 5 4.加里沿右 

r M4» n -^rt> 11 A4» I n haa m v oi kui «^Ai * 9 ^ t i m^i mv v 9 >ai-i /j 、 v-^ rj 


理论的指导可以用不同的模型进行比较，一般地，可以比较模型的 
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roinq f 铱 彳 + 暑的倌 . 佶鉞士 . 说 昍堪刑鉞厶话 .isib 汁坏斫 w 砉一丢 

»—■ y ―% * w | h V |xa* 7 H" / 、 7 ^/u / 一 |>^ ^r~_ |~| 7 |- ^ ^ ^ 卜 , 


_ & frw . W & ft 參 % i m M 丨 to # 砉 ^ 、 A te 金詹 . ^ ^ \ - 丨 » ■ 

残差对目变量的散布囝（对一元回 P 而言），图上的点应该随机地 

掛允 立甘一欠士亚祕囡 ea 不 hiu 女进开 tux 亜:七口以斯进 

MA <H l-L*^T^ ^JSAI 、 I ^4 /mj |_tq » r^ t^C s±L XJJ, /JM *C^\ K^ MXr • 


:.例 5.6' 澈 射性金 Au ): 对发炎的组织有亲和力，有时在诊 
断关节炎时把它用作示 i 踪元素.表 5.4 为注射#天后血液内‘的金 
元素残留百分比3^共 n = 10 个血样. 


表 S .4 示踪金元素残留置数据 


.VI- *■!■ -T* 似一 

• 7 土别 X « 

人 -di itn JUA rrr 八 i i, 

y 3£»5H ITJ tiTTUL y 

1 

、 f \ 

94. 5 

1 

86.4 、 

2 

71 

2 

» 

50. 5 

j , 

2 

t. _ ^ 

81. 4 

3 

67.4 

5 

d r\ r\ 

^y. 6 

6 … 

46.,8 

' > i 

6 

42. 3 

i 

7 

36. 6 


从散点图（见图 15) 来看: r 与 y 的关系不太像是线性的，而且 
放射性元素的衰变从物理学来讲遵从负指数规律, ; 所以拟 合模削 

_ - hr 口 rt 1 ^ ' r I r \-U.X— r^t ■!—»'xa« 人 zfcl 

y = ae - ，即 in ：y = in aT » j ：，； ia ： 仃凹 j « 似甘恃 

1 jy = 104. 4 e T °* 146 2, * 

frrt tl—• JLtm 者 ^^、 I _ »=^ > 1 . \> ■ a a 八 ./•> . .J 一 ' r t - i~ * y ■•"s 、 /\V / 八 八八八 i 

mi)=\m r mrrmmT ^ 66 z . y 9 ^t ti 0 v ^> 66 z . y ；<^ u . uuu i . 

加果首樓拟仝线袢轤铟.右 

〆 ■，■，， V ， . 1 A *|•# ，鬌 f—f ， 〆 -■ ■ * ■/ 、 ■ • f I -# 

▲ 

MM MM t 

3^ = 96. 78 — 8. 8 Y 6 x 

S 厂络朴昼倌 A 17 R s . 柄女 n : nnn i 7k 車 V 县搿蕃 的.口 hk 伤枨 

* 9U r _ ±±^ 1X3* XV ^ • ^7 1/V l-L^ V， V V V j 〜 I I ^/st^ Mr, H W 7 ，、、 J I I 

数模型略差.这是因为曲线在厨部可以用直线很好地逼近. 

广9、估田 rnuta - fc * 吐一 e 逋吐奋 66 且日 n 估雄六了 ra i [4 士丑 m 

V ^ l>^ / u ^ y—I JJ 1 A ' AC, 1 丄 ASS MV ，“妗 r 队 -U- J M =4 I 夕 I _T L 

统计检验证明相关关系成立，也只能说研究的变量是统计相关的. 
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图 15 放射性金元素的衰减 


而不能就此断定变量之间有因果关系，因为变量5与变量线性 

上《 _VA 一 ^ 八 / fc w 士 》 -crt r^l 入白 上 L Al\ H -r« v • 、一 "》 

和天笮円酣定'匕 iu 邵艾力一 T 艾星 z 的琛汪尠明 ， fm y y ^ wx 乙冋 

_能根本没有什么因果关系.比如国外有人发现喝咖啡的习惯与 

b ' :,. : I r 

#■ *■ > 、 » J * . 丨 > 、 a>Jk— ■ ■ 、 _■* _ * -、一 、 t 'I »-• K —* t=» _^.K — C_^k .V \ . -JC* ■ * 一 —JfL- ~W~* • 

酒:心 炳的友舸咼皮犹订和天，卞是就句些又草戶称哪啡是厄及人 
们健廉的…+ 隐串.曰本 讲一 来的碰吞发视.喵咖眺去銥宫的 

II -4 / <J^v »-■ V I | ， U* ，， U *、 7 /|—I ， ■、 L : M w / U '/U 7 ' l | ^ F^l ^>V 1 ^ ^ V / U * ■ ^ 

* I 

* • W I 、應 k 丨 I ▲ -» 毚 A b - ^ - 丨 ♦ •»■ ■_ V * 詹 __ ▲ • i 备 • b • • m 灰 • ~ 

病友病率是与吸烟和瑪糖辑人有夫，而这两者与喝哪 啡的七 惯郡 

宜 fSFifl 龙 

网 / 人 'm /、• 

(3) 回归的因变量选定后，.自变量的选择十分重要.如果遗 

但7舌萌 664 E 软亦甚 BI ? 乂进并 III 能 TTiA G nrfi 介 G 桂 >U A 7 KT 口矣来 fr 

vm 4 里 ， /jp IF 3 t / U -，| IIJ » CX ：^ 3 ^ 

估计是有偏的.如果自变量之间有近似的线性相关，这时模型中 
的估计量很不稳定，参数估计的方差很大.下一节讲的回归自变 
量选择方法只解决了部分问题，在选择自变量的问题上还是要进 

f t 

行深入的分析研究. 1 

(4) 用回归方程作预报或控制，必须考虑对要研究的变量有 

，■▼▼ - -产 - ■ W W W ~~ - ^ W ^■，史 w V ■■ ▼ V ， ■ ▼ - ■— "- w ^ -w W W ~w 

影响的各种未引入模型中的因素是否有变化，即问题的背景是否 
发生变化.如有变化，那么原来的经验公式在变化了的情况下可 

參 

人量』 ■ ■ . ■ * ft ， ■ 1 tm 」 _ • • ■ ■>*- 九 ―V f ^ 1 \ * t . #. ^ . fc ■、 ■• t ^ i . A . ^ t ■■ ■* 

酡小丹适用，潘安里新近仃讲艽. H ： 卯，収肘驭朿的 7 C 的艾动胡:口 J 

能 影响到许多经济变量之间的关系. 




Zh 3 





IO 


9 


— 8 


I 5 


■T4 




— 2 


1 00090807060504030201 00 





*§6 回归自变董的选择 


在线性回归分析中，常把所有可能影响因变量 >• 的各种自变量: Ti, 
X 2 ，…， X ,都列出来，根据对它们的观测数据建立 y 对^，0： 2 ,…， X ,的回妇 

古程 _ 技樣 傲的一个姑占就县市能右一此白亦畺対 v 的歡 D 向粗儿其至沿右 

/， 1 I r-» ^ I 罅 l<#W I -# I~I 4 卜 * V ' I -4 畢 *^ 鏵 a^k _ ■ - 1-^^- I ^ 

影响，但也列入了回归方程中，增加了取得数据和分析数据的负担，且得到的 
'回归方程过于复杂，不便使用，另外，从随机误差项方差/的估计 C? = 
Q/(n— 夕一1)来看，多用自变量不一定导致较小的 (？. 所以，我们应该建立 
这样的回归方程，它包含:^,:^，…， A 中那些对 y 的影响不可忽视的变量， 
但不包含那些对:V影响不大的变量，即从 UhA ， …， X,}中选出一个适当的 
子集 Uq ，: T, 2 ，…，％ } 使得建立的回归方程恰含有这个子集的变量.这就妃 
著名的回归自变量的选择问题. 

回归自变量的选择问题在应用上和理论上都十分重要，从上世纪60年 
代以来受到了广泛昀注，意.这个问题的头一个困难是怎样比较不同选择的 
优劣，即最优选择的标准.从不同的角度出发，可以有不同的比较标准，具体 
介绍如下. * 

f 

以下将_变量 X ， ， X9 ， X A 用代号1,2, …， 6来表示，记1= { 1，2,…，办} ， 

• , , w — 画 • mm mr , t ▲ -■ _ r ^ - ， ， ■ 汰 

T B' -^T Tib AA r^-t -rfhr AA 入 Ma iTL A m T AA ntil A r^-t ，Tfrt -S. 、乐 

又疋 ki 取 trj 日戈：里 trj 王朱 • 议 /! 定 j try 丁朱， wu 八 a、j m 一 it 曰： st 里 J25 it 

{x,：i€A}. 记#(八)为 A 的元素个数.若八=<^“ 2 ，……<6), 
把 X =( x, v )„ x , 的第 h 列，第 i 2 . 列，…，第4列抽出来组成的矩阵记仵 
X(A ). 从数据 ( X(A),10(T=(：^, m ，•••，％)')出发用最小二乘法可得回 IU 
方程 ： . 


y = ^o ( A ) ™h > J 貪) ( A )(6.1) 

>eA 

这叫做与 A 相应的回归方程，其残差平方和与回归平方和分别为 


Q(A)=||y-X(A)^(A )|| 2 

■ * ■ * 

•» 

f ， 蠤、 ■ / A v 

UiA)=l yy —QiA) 


( 6 . 2 ) 

/a # % k. 

6 ) 


苴由 

V 


^ CA ) = 0 o ( A ) 我 ( A)Y 

T A/i 二 ^ 生斗亡 O 办人 -m tl I+I 44> 人《旦 /1^ ，，占 /1 士 人 Llr 份二 Z ： 佐 /iwjo 

1 trj 厂朱六书 r I > jSC / AT ' T ^ 一 \ 取 Mi FTJ ， 聊文节 I 比议丁禾 l / b 力 
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的标准.常见的比较标准有下 列几种 ' 

» • ▼ ， w _ ― ， - ■— # W w ， r t —— — w 一 

/ 1 、 TTT X/-» ~AZ* TTT > • -T_m 曰 A. 口 ft -Ul^ A 

炊左 t 刀 w 取 /p. km« ist 




0( A ) 


n —\— # ( A ) 


达到最小. 


(2) 平均预测均方误差最小 .， 即找 A 使 


I 

f • 




达到最小. 


(3) C p 统计量最小. 即找 A 使 




Cp 


Q ( A ) 


QO )/( n ~ p — 1 ) 


+ 2 •井 ( A ) — n 


达到蠢 小. 


i 

t 

»f ■ 


y a a vA* mil an Xlx a 

k ^) mm - /i is . 


;l • 


AIC ( A)=ln Q ( A ) + 2 


林 （ A ) 


n 


达到最小. 


(5) bic m ® H . 即找 A 俥 


RTP/A^^ln Or 4^4- i ± • 

A ■^息 \ A ▲ / ▲ ~ I -] I 、巋 •/ 


In n 


n 


达到最小. 


这些准则都有一定的道理，很难说其中一个比另一个好，它们的理论基 

紬仍值彳县檫 it 汶榉.我们要找暑优回归古稆就很难倣到. 不付 ，定阮 T 作 

_r _ • I ， • ▼ , ， - v ■ ， •r ^ v _ _ k m ， - ， ， ▼ _ ■ * w< ^y • , i F ^v ^ w ， ^ ， • ， ■ — > ， 

常并不追求“最优”，只要能找出比较优的回归方程就行了.下面定义的 

?宜取的回归方程”就是一种比较优的回归方程. 

■ 1 / ' 

4 

给定 A ( ZJ ， ieA , Q ( A -{0) — Q ( A ) 可用来刻画变量&在回归式 （6. 1) 
中的作用（等价地可用 L /( A )_ L /( A _{ i }) 来刻画）.这个量叫做: t , 关于 A 
的偏回归平方和，记作 P ,( A ). 考虑 


F t ( A)i 


Pi ( A ) 


Q ( A )/( n — 1 — # ( A )) 


(6.4) 


r' X A \ AA 」一 丄 cr nrlt A r4-t />t- CCJ AA 」一 丄 /»入 TOZ 人 4l£/r T7* T7 1 r\ 

r,A/wtrj 八 /jv 乂吹 j Xi 仕 丁朱 "firm try 八 ，」、• 坦疋門 ’「似 r 进 , j -出 

F 出 进 . 
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定义 6.1 称子集 A 县可剔除的，如果存在 / fA # 得 

▼ ~ ' —■ ■ ~w ^ 'W ,, ^ - - - — * ， ^ ■ -^― 琴 • 

出 

技夕狳 A 洳不可思1 睑的汝罕隹 A 县挑抓的.芸讨佯侃 T — A 诒右 

r 嘁 ■■■/<■ -# ^ 1 ， 4 、 »-• V * W V -xyw * • IK ^ I M W 7 T-^ ， V-L^ I ^ ^ - T W _ 豸 

i^AumxF 进 

汝；隹 a 且古而的.其亡且尤 Hfjai 除的而日且； Hfc 々 k 6 <i 与古而；隹 A * 0rtr 6 <i 

r V 4' J ITT ； i * > c . H ^ y LJ I ， ^4 WJ n、MV llkl r~l. VW y I H ^ • ~^J J=U J TPi -* * "I M /^ L . M 4 

* * 

t 

回归方程 (6. 1) 称为宜取的回归方程：宜取的 y 归方程是比较优的，大量实践 
表明，只要 F 进和 取得适当(通常取匕=〜在[3,8]内），得到的宜取回归 
方程颇有实用价值，利用它进行预测和控制往往令人满意，因而受到实际工作 

者的欢迎.但是，宜取子集可能不止一个，究竟哪一个更好，宜取性和上面介绍 

!. ; 

的 n 抽件白 * t 麻 mu 右从》 土：玄4令此 mot 被右 : 佐车； 4 t 一 也的畑办挺々卄 

wv / U，| I I/Ll 八 I 丄 IJH 7 VJ I~J II J I '4 J MA. ^ H^ Viv r g • 

既然宜取的回归方程有实用价值，怎 ¥ 从原始数据出发得到它呢？使用 

\ * 

著名的逐步回归法就可稹到一个官取的回归方稆.现在夹介绍这个方法，其 

W 9 w ~W - - w W ^ ，零 _ W "IV ~ ^ ^ ^- ■-■ r • p » ^ - ' ^ V W W W W -m 

要点是从空集出发逐步引人自变量，同时剔除相对而言不重要的自变鲁，直 
到不能引人新的自变量也不能剔除为止.下面角数学归纳法 给出逐 步回归 
法的严格表述.用 A t 代表第£步建立的回归方程所含的自变量的足标组成 

* — 為 

的 集合. 

第0舟.今 An = (?f (空集）.汶时回归方海县 

* — / /> r \ 

y = y ^ o . 0 ； 

第1步.考虑引人自变暈.对所有分别计算 

F{ . } 0^01^001^2 
’’ Q ({ z *})/( n -2) 

(这 rfQ (0) = / yy ). 找 满足 ’ 

F { ( {U }') = maxF :({£}) 

. . 1 , i^I , 

如果 PVUzjXP ^, 这时逐步回归过程结束，最后的回归方程是 （6. 5); 如 

» j ，* 、 • ， 

m . X ? ，/: \ w I ? I>y Drf 31 1 白 TfK 县* As . A — i : \ • ff '^ tV t =: A -ttf rtr 66 mi 

不上 ^ \ \ / 上进，垃 M，J 7 暑 /v 1=1 又里丄 （1 ， 7 八 1 — \ M / 7T 仕 一 LL 八 1 TO Ai!L W ；； 口 

归方程 

A ^ y A xln y A v /" /^ /^ \ 

J 卞啟 i 1 ,/ii ) Xi x VO . o ; 

«er 9 4 t 去由台仁不31人在 C 66 白亦县 7 rf fif ； 古 XC . 1— A 乂 VfilU +甘 

不 L 少 • -V MUi^ WG 口 J I / 、取 I Wl ；； 口 一 SC- 里 • /vj )^\ "hJ ^ A 2 M J4 7i'4 V\ 升 


/ A I A / . \ v 

^ t CA ! Uit }) 


0 ( A ,)- 0 ( A , LJlil ) 

^ 矗 ' ^ 属 、 r 

OCAi l J ( i )) /(n — 3) 


找“使 
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F ； ( A ^ l J ( Z 91) = max * F.(Ai IJ ( z )) 

1 te i-a x 、 

若 p \ 2 ( A 1 u { izIXFa ，则逐步回归过程结束，最后的回归方程是第 1 步得 

zcili^i 七： m/edifcir r a ii/:\、、ev milPfiTfK 县 * a — /: - \ 4f. 

^*J py J4 ^±L\yJ. f^t 上 ， ：2 V-^l VJ \ ^2 / / /▲ 进； ： HX7I /V 又里上 * 2 9 V 八 2 — \ ^-1 9 ^2 f 7T 

建立与八2相应的回归方程.•- ‘•- " 

份卜而的讨耜/舟.锒刻的白亦骨的&标隹仝为丄.相 

_ * » r ■ • r-» _ I — * ■ • 内 ,fa -# - — / /> _ ^f. *7* Y i—• '~1 “ ^ *W# » |—f ，， ■ 一 ‘ ， _ " 

I % 

应的回归方程是 " 


-… y = 0o (A t ) + (A t )x t (6.7) 

f " »eA r ' : 

* - ; . 

JktfAr* I _ • La 、 廬 i *-▲ . ▲ I ^ • 3 * Jl * a 、 t 

弟 f 十丨 步. 宂考思驼告剔际 •— 对母昇 

… t-w a ?_ • QiA t — {f}) —Q(A^)、• 

r 公八" 一 QCAc )/( n - l ^# (戎 )) 、 

‘、' ■. % * 卜 . ： 

找 h 使 

F io CK t )= minF t ( A t )~ 

0 ieA. 

如果 F ,。（ A t )< F 出 ，则令八…二次一丨心卜即涮除；。，建立与咸 +1 相应的回 
归方程，然后转入第纤2 步； 如果 F ,。 （.人 ~)$ F 出 〖这时 不剔除，考虑能否引入 

^Hr B. r+_L tlr* •，- T A 、 I AA* 

m 戈 : 星 . i^z i—/\ t it 畀 

… ,,,.、、_ Q(A t )-Q(A t [j{i}) 

心、〜 Q(A t [j {£})/(n-2-#(A)) 

找 i 。 使 < 


F , ( A t U {* o }) = maxF , ( A , U { i }) 

0 >ei-A t 

如果 F ,。（ A , UU })< Fa , 则逐步回归过程结束，最后的回归方程是 （6. 7); 
如果 F ,。（ A , U U })>〜 ，则引人。，令 A , +1 = A t U ( to }_并建立与 A t+1 相应 
的回归方程，转入第£+2步. 

这样我们用 te 纳法给出了逐步回归算法的‘过程 .. 这个过程可直观地 

播揀加下.白亦畺县诼朵引 A 锚引人 一+ 莊亦畺.思生給本生前31人古 

I • |—I VI ， ^ ^ V • V I ^ ^ I f4W\ 7 ^ u 1^3* ^BSU / W WV VI ， > 

程的变量是否要剔除，若有可剔除的，则从影响最小的开始剔除直到没有变 
羞可剔除时再考虑能否引入新的变量，若能引入，则筅引入影响最大的新变 
量，引入后马上考虑原先的自变量是否要剔除，……，到无变量可剔除时再考 
虑引入新的变量.此过程进行到不能再引入新变量为止.这时得到的回归 

古耝栢县吉取的间胂古耝笪法的垢围加® ifi 

/ V . I—L. L>*w 1 L r-* V f—* X ― ■ /V ' I—* ]^~T~ 腳 4^ " V I * w • 

、 ■ 今 • L r • fl_¥* -■ — » —» I I -.~~* r*A. T ti J , - ^ - * - A m * 人 ▲ 處 • WM • L* . f 上 WV—^ 

迩步凹妇耽然定乂 51 人乂剔际，那么 E 杌书一 T 驼吿任句限步悖止的 I 口 J 


题.答案是肯定的，严格证明如下. 
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图 16 


记 


〜=■■ 〜 ， b r = — , 

n _ r —1 n _ r _ 1 


1,2,…， />• 


显然 




且不难看出，子集 A 可剔除的充要条件是存在£6 A 使 


r A f • 、 、 ^-v / 4 、 ✓ A X 

iz/;—y^/i ； r t k/\) 


Q(A) 


m~r — 1 


^ a r 


#,( 4 )) 


子集 A 不排外的充要备件县存存 i f I - A ^ 

了 ， ■ 胃 ■ , ， ■ I ， f _ _ _ ^ 


Q(A) ~Q(A U ⑴） F { (A\J {z}) 


^ a I i I * ■ \ 

W、/iU it)) 


〉6 r +l (/" = 社 (A)) 


对 I 的子集 A ， 定义 


UA 厂 W —— pOpl (A) 

其中 ^ = 1,^=1+^ ( i = l ，2 r ",/0. 

引理 6.1 ^ 0 . '' 

» 一 - ■-■ ^ 

(1) 若 A , 可剔除，则 
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( 6 . 8 ) 


(6.9) 




✓ A 、'- ) >r-v y A 、 

UAA ;^ g (A ) ； 


(2) 若 A , 不可剔除但不排外，则 

Q ( A t )>^^ L > Q ( A t+1 ) 

«P 昍 .HA 甚4可划险 Jll 笛/4-1也 Jill 除 一+白 亦鲁值剖4 , ^芊县出 

•tu- • N y -T_I ▲ *1 • 4 WJ |X|、7 yvj >n-/ ^ ' 丄 ^ ^J'4 I I—I • g T^ |TX ▲ *f-r 1 » J A& l-M 


(6. 8) 式可知 


Q(A … ）一 Q(A t ) 
QCA t ) 


<a r (r= # (A,)) 


11 txt 

/yviiu 


)>i I —Q(A f +iQvAi-i-i 


—Q(A r 

Pr 

a(A t+ i) 
a(Aj 


+ i 


0( D 


(2) 若 A , 不可剔除但不排外,'则第 t +1 步必引入一个新变量得到 


A 二 n 曰山 / /? n \ —/r n 

a+ 1 ，丁 7B m vu. y ^ wj 7 ^ 

Q(A|) —Q(A 出） 


Q(A 出） 


^> h - 丄' ( r = ±t ( A .)) 

^ _# ■丄 ' • I I 、 一 一 M . ' ， 


从而 


v^V y A S. ^ 1 I » \ ✓ A N. 

UA/if 卞 ; 


、 a ( A i+ i 


a(A f ) 


V^v /A S 


证毕. 


M a. * M - « 、 J U 處 ^ _ ■ _ ' a _ • g* r« A. f / . a _ • t I - % - 

51 埋 6.2 右仔任々满疋 KA k 是小卩』剔际的，小是且 


取的，则 




a(AJ 

证明:多次使用弓 I 理 6. 1中的不等式即得 • 

引理 6. 3 设 «1， Ah 不是宜取的且 # ( A f )<#( A ,) ,则 Q ( A t )> 
OM , V 

证明： 从条件# ( A f )<# ( A z ) 及 t < L 知必存在々，(<々</, 使得耒 是不 

b 

可剔除的.由引理 6.2 即知_ 

Q ( A .)>444 q ( A ,)^ Q ( A ,) 


av 


证毕. 
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定理 6.1 芒临界倌>0,_逐舟回归法的筛诜变量过稆必在 

w - -^― r ， , F ~~ ， r ^ ▼，瞥 w ， ， r • _ • 丨 -，-■，- w ^ ■ W ~ 

I 

-Ar rn iK rn .1 
节 PRZFtom 

证明① :用反 证法.假若筛选过程永无止境，则得到子集列 Ao ， A ， A 2 ，•••. 
由于不同的子集至多有 V 个，故存在 t < l 使得 A , = A M 从而 Q ( A t ) = 

j^\y A 、 、- U I— I -rtn /» o AA A-l- 、人 -Lrt -tJL. vx? iK rrrt tl—» .vl- JE»A» 曰 - 4cte 、士 v_x -ra •、/ /-r* 

trj ^ r ^^ BTrm ， ax 您戈:星师 es 以往弘、仕书 

限步后停止. 

vfm 

，u . I ▼ 

逐步回归的计算有简单的递推公式，所以计算釐并不大，许多统计软件 
包中都有计算逐步回归的程序，实际工作者很乐于采用. 


_ 觚 _ _ -*• ^ 霞 ▲ ^ t ^ . m i > 詹 _ i _ 

§7逻辑斯讲 ( logistic ) 回归棋型 


在前面介绍的经典线性回归模型里，因变量（响应变量）是连 

Ldb, -nVr 貝 - -/r* nz^ -r- IA - 山 / Arfcl □“ 曰 4 丄人 Ytit ^ AA TTf \ ，田 ： ZTlI HO tiV^ 曰‘ 门 

殊戈 :里. 住大卜小丄了 ft * 、付力 1 j 疋个丄云观豕 uv 切■九/ m iaj ! j 四戈:里只 

取分类值，尤其是只取二分类值（即0或 1) 的情形，这时就不能用 

、 “ 77IT 上“ L【-rtn > * .、丄 ~~z^ HfA 丄 jnrt — ^ ^ *l 人 t=^=f JLt* Mr* .11^ l t t i —Itr V 

刖囬 mi 处埋力汰 J • WJitU ， 用： C 衣汛一 T 豕駐的千 HX 八 ， I = i 衣豕 

该衮轾亦一段时间内齙军其种耐用消稭品（例加汽主）， Y =0 丟示 

/>^ m ■■ ■ • ， I ， I » v •■，， ， •，寸 〆 ^ ' — - ^ r ^ • 

— 置 — wrti_^ 、-声 v \ - ^ I > 1 t 、、 t, 1 墨 4_ I— » Wt 、 /、— jrrt j / t ，■ 一、 t i i . 

小赐头这柙 嘢用 泪贸品 • 获 iu 安饼艽的是概半 /ny = i ) 与工的 

/ j 、 • 


更一般地，若随机变量 Y 只取值0或1，有若干个变量：^， 

^ 戥 DlSl Y 的劢倌.筇们笨/、的县継處 y >= P ( y =1 ) 县加佃 

一厶 7 7 一丨 - I 蝻 ♦ P-i V MO. 7 II J u P-i V >NL^ I^U - 1 - -* 、 ▲ ▲ / >nl*t | g 

• j 

依赖于 xi 9 x 2 9 ••• jx k "! 


对夕的研究等价于对^的研究，因为后者是 /> 的严格增连 

丄一 P 

续函歎 •, 4叫作发生比或优比 （odds ratio ). 

c±? %'/ n 1 4tn ffl - £i* "~c* tTiI -V* Ta — 

/ t^c / •上 3 <m 木节 r : 

In - =00 + 2 piX { 乂 7, 1) 

丄 — P i =\ 


參 


①这里给出的证明是根据江泽培先生的证法改写的. 
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( 宜 由 H 县登粉、 Jll 餘一公悉佶亦畺 

、，、 I g^Aj 7 f^X 7 7 f^/z >NL-, IM ， 7 ， K4 ， —^/v un^ * V * ♦，， 

与自变量 A ，…， X, 的关系符合逻辑斯谛模型. 

为了体现概率与 工1 ，…，工*的联系，常写 p = P (Y = 1 1 Xi , 
…， A). (7.1) 有下列等价 形式： 


k 


P ( Y=l I x x ，•-- , x k ) 


exp {^ + H 译工 




k 


1 + exp{/? 0 + HA: ，- 


在 （7.1) 中，成, A， …，啟通常是未知的，需要利用数据进行估计. 
一旦这些参鹼的值确定了， （7. 1) 式就可用来对/>进行预测，也可 

用夹对各白亦畺的重萆件讲杆 读伦 . 

,,，严 _ _ ■ ^ 9 ^^ 9 V 一 _ ■ fc ▼ ■ - _■ ^ * I k _ ▼ 

^简单计，以下只考虑々 = 1(即一个自变量）的情形，用： c 表 
示这时 (7.1) 化为 



p 

1 — p 


怂+ 饵 JC 


令 p ( 


prv 


丄 X 




则 



p(x) = 


exp {/? o+^x 


l +' ex ’ p {^+^ x } 


(7.3) 


o o DB 9 4 S . M - lh/hl ^ idt - r+^thin 

i^ iT im y\ fjQ -ju : ^ci rp "hJ i yjMA ; -*tx.yv im ^ i ^i h 

加权最小二乘法. 

最大似然法 ：设有 下列数 据：: ^ = ^时 Y 的值是％(〗=1， 

2，…，？ 2) ， v : = 0或 1. 偷泮音.坟里工：县白亦量工的第 t ’ 个信，不县 

^ ‘ ^ ^ ' 邐 ▲ ■■ ■ - - _ ‘ ， r y y ^ i ▼ , p ■ ■* , , ， 

(7. .1) 中的第 z ‘个自变量！ 

显然， 

P { Y=yi |:^) = (/>(:^))，* (1 — />(x t )) 1_y « 

于是观测值 (A ，％ ) ，…， （〜,％)对应的似然函数是 

* w ^ 

L(Bo ^ 1 ) = TT {p{xi)) yi (1 — ^(x,)) 1- ^ 

I I - j_ ■ * ▲ 


从而 


费 


261 


_ 



令 


n n 

\nL((3o 9 pi) = y ] yi ((3o + Aa)— 〉: 


ln(l + e^+h ) 


>ca /ivt i»lv —Art 

1 守 1 以热刀枉班： 


dhiL ( 恥，队） 

^ JL ^4 


(^〒 0，1) 


n 


X .1 / 


exo( +/?i t ： ) \ 


1 + 


—17 v r^v j. — c / i 


0 


T — ' f PXD ( Rr \ " l ~ /?! T .: \ \ 

V [ V — — ，- v 「 v . < - - - — \x =0 

~i V ' l + exp{^0 -\~ P \ Xi } / 


若 ( A > ，爲）是似然方程组的根，且 a ，•••，〜不全相等，则似然 
方程组的根是唯一的，而且(或，或）是 L (爲，爲）.的最大值点，因而 
或，免分别是 ft ,， A 的最大似然估计(可以证明 ： lnL (戽 ，爲） 是二元 


严格凹函数)•但应注意的是，似然方程组有时无根（例如所有乂 
都是1的情形）.在 SAS 和 SPSS 等国际流行的软件包里都有计算 


最大似然估计或，成的 程序. 

丄一丄 t~» s I — >. 、丄 .it* l 、^/ - -Li~? iL-4- -v^tu -sir _ii* 、n _ ■"* i r-*j. t r 

那仪 取小一米拔： W ： 抜对奴惦书些荷休安氺•议 ； I = A 时对 I 

作了 I 次观测 （ A 较大），其中事件 { Y = l } 发生了 n 次 （i = l ， 


2, …， m ) ，这里 a ， …， Xm 两两 不同. 通常用 


z' 


In 


ni 


r t +0. 5 
- ; r i To . 5 


作为 In 


P 、 工 i 


— p(x { ) 


的估计值 G = l ，2, … ， w ). 


(7. 4) 


令 


v . 


( yz t + l )( y ^ + 2) 
〜 ( r ; + l ) (〜 一 r t + 


(i = l ， … ， m ) 


(7.5) 


3 (A) ， A) 


#y i 

；= 1 u i 


— p \ X { ) 


使(戍， A ) 达到最小值的分别称为戌， A 的加权最小二乘估 

v 8 9 w m w 

计.这里丄，…，丄就是所谓的权.可以证明，加权最小二乘估计存 

Vi v m 
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在且唯-•令 ^^ = 0 ㈣ 山， 得方程组 


m 


m 


m 




_ I _ 00,1 \r^\ 


m 


X , 


m 


^ Xi , ^ 

hjj *Li^—>— -xn Att : rr 彳 b 4«r» J-rf B 丄 i-X* ) 丄山《 — r^ 

聊 iiL 刀征迅, WJ1 守刀 U1X 取 / J 、 一术 10 TT 3 W r 




x；z 


Vi 


A 

Jo 


U L _ iU ) 


ihh —I2U) 




T T 


Lih—yhr 


(l 山 一 I2I5 ) 


这里 


-i 


?[， 


m m 

H ^=E 

1 Ut 1 


2 


£i 

Vi 


(7-6) 
(7. 7) 


m 


u = Yj 


XjZj 

Vi 


tn 

w - » w 


4 =E 


£ 

V' 


加权最小二乘估计是基乎什么思想导出的呢？本来应用 

广 /) ( *7* ^ 

« ^ ft % ^ M j •夢 M & ‘to ^ 身 ▲ 秦 t ▲ k ft i V fci 

1 作为产 - f 7 - T 的估计，为 r 避免分于和分母出现苓，所以用 


rti—Vi 


1 — p ( xi ) 


rii 


n +0 ^ 作为的估计.可以证明（基于概率论中的极 


r z - +0. 5 


限定理 ）， A 


1 — p(x { ) 


In 


rj + 0. 5 


77 

* V • 


r. " I - 0 . s 

• 7 I •» 


近似服从正态分布 



p(x { ) 


1—— />( J ：; ) ^ W , /> ( Xv ) ( 1—— i )( x ；)) 

t 丨 ^ ' 泰 ^ — ， - ■ 





工且 ^ — i 〜 _ P ^ Xi ) _ l ^ i^t m ^ r / i、i he " \r / a 八 、 a — 

J 疋 ‘i — Ail ^ p(x ) 1 tl ，於王 ALL Ibk /3 l)C /yv i > \\J J LAi / 9 LAi — 

A 篡 

(行,/>(工,)（1_/>( < 3： 1 ))) _1 、自然想到用1； 1 估计 Li 、 Vi 的定义见 

(7.5)). 利用 (7. 2) 得 

之, = /?。+汶工;+6*. ( z ’= 1，…， m ). 

I I ~ ~ 

注意％ ，… ， v m 不一定 相等. 令 6 = = 1， …， w ) •贝 !] 




263 


% 









抆里 

w M 


e 


r ■— i 


的方差折似相等/仿效诵常的最小二乘法的梘法 

，， p ■ • • — v -▼ ^ ^ ^ p^- w ^ ，響一 ■ ■ ■ w ， ▼ w ， ■ ■ • 


应找译) Jpi 使得平方和 


m 

▽ 

Zj 


rz : 1 h 

i _ I 、 、 V ^ * 


ipo +ft 


2-4 - Z^ll #lv 

J£i 太 _J 取 / J 、 


这个平方和就是上文的 Q (戽， ft ). EP 而使用加权最小二乘估计是 
有道理的. 


例 7.1( 社会调査) 


个人在家是否害怕生人来？我们研究 


人的文化程度对此问题的影响.因变量 

1，害怕 


y 


0，不害怕 


自变量: T 是文化程度，取4个可能 的值: &，: ， X 4 ，这里 

^=0表示文盲，: c 2 = l 表示小学文化程度，: t 3 =2 表示中学 
文化程度 ， A =3表示大专以上文化 程度. 


根据某地的一项社会调査报告，有下列数据 


自变量 U ) 
0 
1 
2 


不害怕 ( y = o ) 人数 

* - r 

11 

45： 

66.4 


害怕 ( Y 〒 l ) 人数 

7 

32 

422 


3 


168 


72 


我们可用逻辑斯谛 （ logistic ) 回归模型对上述数据进行统计 

分析.用実沄一个人 i 仆耜麽县 i 时審怕生人的概銮，刖 

/ ^ Ip/ 1 I - / I ， ^ ' , - 9^^ r. p ^ I I ■ ■ - • _ • • | 9^9 a - ， ^ w-m ^ fW I , — I 

p ( x )= PCY = l \ x ). 考虑模型 


In 


, / \ 
pKX) 


— p(x) 


= po 七 pi 工， 


我们用加权最小二乘法估计 ft ，爲. 

枏抿 卜列 教据.刺宙 （7. 4) 和 r 7. 可笪屮& = —0.384 7. 

■ r-、 1 • ，-# ， - 、• - — , I” ■■響 —J 一 — f 

z 2 — —0. 326 9 ， z 3 f= —0. 451 5 ， z 4 土 — 0. 842 5 ， ==0. 219 9 ， v 2 = 
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0. 0R2 7.7). =0. OOS =0. 01Q 7 . 

^ W w 7 J V — 7 A V • • 

/ mm V / v * _ ■— 少 t 亡 a 一 亡 m ^r • 曾 

利用 U . b ； W </. /) 口 J 得到卢。 -0. 01^,^ = — U . ⑵，卞是令凹 


11=1古泡 

/—I y^ ' I— 


n 


P ( jo ) 


—p(x) 


o m ^― n 9 R 




即 


PCY=l\x) 


• 


exp {0. 013 — 0. 25工） 

lH - eyp {,0. 013 — 0. 25 x }, 

»• 

一 L« .U, At-i I ■、 • /【▲ -rpt 4 sl> - A * .UU /f - 1 上上 * -iOiT vAf 4*J> /rt* 

出肌邓， 一 t 八乂 m 枉反腿同，贵 to 王八 trjm 竿趣 m :. 

以 卜只对 一个自变量，的逻辑斯淹回归作了初步介绍.若要了 

• " ■ ■ ■ ■ ， • _ r w f，• 'w » ■ ■ 广 ' _ ▼ ，- ■ »•， w v ^ ， • w w m — » ^ r ■ ▼ 

解更多的知识，请看张尧庭编著的《定性资料的统计分析》一书(广 

西师菰女受屮枥奸 .1 叩* n . 

r ■ ■， y '§' 1 ，、 < 學 ■ ■ / ic^v I 一 ■— '•、-、-—，， 

1 ■ * * ■ i^rT^i ■ ft »■« «^ 4 rm * *» «W» »»，***■■■ 丨 ■■ 丨■丨 * «_■ ■、 

t ： \W<\'X^ ： <*>v%^ ： \v> ： <- ： * ： * ： * ：： ■: X.- ： * ： * ： W ： v ： 'C'^： ■:: ■:•:•:•: 

«<%'*W' a *iV< 4 0 B ^WV«>S 1 *V.V*VkV>*V<V> , i*> 

^ . I ^ * ■ ■. ) t 

i . 证明定理 2.1 申的最小二乘估计量 6 还可以写成以下三种形 k 、 


n 

y ; 


-v* 


^yi —nxy 


n 、 a 


n 






nx 


m a 


n 


2 (a —王): y * 


n 


ixi — x ) 


(^ h 


n 


— 歹) 


n 


^ (x ( — x ) 2 


9 沿乂 /； 斗 t — i 祕 Wrfmftl 玄 * th /i iKi 县 /I 、一赤仕 •?+ i 、口二 = ^_|_/；^ 

w ^ <>% i 丄 y—I >gs ^a. ^ yiy t — *>t^ im y \ ， kl^ y% 认 ' 

t 

2, …， w ， 证明 


n 


2 ^ ~ y ^ 


o 


■M 


乏]工 ,（： y , — 3O 




0 
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份对固 一 * 细占 （ T . 


斗則田蜃 A 一乖法抝会一汝才 

/V /V 鎊 ， I 鏵 ^ ■ ， ■ 、豸 >^1 卜 H 1^ ^ ^ 


I _ a. W_# tv _ I _ I _ \ ■ ■ 、蠢 # t I *. «. . M iv IftV * A. # » ^ >. V . — ^ 一 

十杜和二仄式 ： y = 体十历 x 十块: r % ta 明为忭么二仄瓦拟甘的戏爱干万祁 


不会大于一次式拟合的残差平方和. 



4. 为了考察维尼伦纤维的耐热水性能，需要探讨甲醛浓度 （ g / L ) 对指标 
“缩醛化度”(克分子％)的影响.安排了一批试验，得数据如下： 


甲醛浓度 X 18 20 22 24 26 28 30 

缩醛化度 ： y 26.86 28. 35 28.75 28.87 29.75 30.00 30.36 

从经验和理论知二者的关系是近似线性的，即有 

y =^ o ^ P \ X+e 

o o 66 黑 /I 、 — 壶 ii:4 丰丑涵山 面私 * *riB W f51 Itl 古祕 6603 抵 

uli /% ，/ji w;i ，一 im v \ ，夕 I «hj uli /^is y^K w ^4 y-i 

5 •设 ‘ 


jyi = a + ei 

y 2=2 a — 6 + et 
V3 = a + 26+e 3 

其中 a ,6 是未知参数， e 〗， e 2 ， e 3 相互独立且 Ee , = 0, VarCe , ) = a 2 G = l ，2, 

» « 

3). 试求出 a ，6 的最小二乘 估计. 

V . 

yi =^o + j 3 ix ,- +择 (3 xf _2) + e t ’ (z = 1,2,3) 

其中： Ei .J ：， . ： r ， R 4 E 0 • A . /?1 .Ro 县去知卷物 \ Vi * Vo .Vo 县观测值 *€o 两两 

W -晨 ， - 4 s ， -从 1 V ， A ， r »£# ， P ，， *w , — ^ 1 ， ^ U ， ^ ^ > _ ■ r W ;聲 j *— ,_X f ~ Lr •— \J » ▼ 

不相关， Ee , =0, Var ( e , ) =/ ( z ' = 1,2,3). 试求出戽，坏，典的最小二乘 

估计. 

7. 某医院用光电比色计检验尿汞时，得到的尿汞含量 （ mg / L ) 与消光系 
数读数的结果 如下： 

尿采含量 x 2 4 6 8 10 

消光系数 : y 64 138 205 285 / 360 

/ 

im ^ hr^ 士，匕 Ml 处 ill* 方 

ir 疋 y ^ ^ ;iaiw 软 t 土大尔 

各次测量是独立的且 e 〜； V (0,< y 2 ). 试求出炔，與的最小二乘估计并检验负 
是否为零（检验水平取 0. 05). 

8 . 下卖由 列屮 了 r 和 v 的而个烊太的姑 I 倌、烷准荖和相羊系数. 

一擎 9 f / ，霽 ■ ， ， ^ P ,■ 9 - fc ， / 里— _,， , 

样本 样本量 n x y S x S y r xy 
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1 600 5 12 2 3 0.6 

* 

2 400 7 10 3 4 0. 7 

试计算两个样本合在一起后 x 与 v 之间的样本相关系数，并说明这个相关系 

- ■ w W w W W , , W - W r W V ^ ▼ ■ » W ▼，飘 ^ ^ •- , ^ - -- ，•- 

数小于原来任何一个样本的相关系数. 

9. 下表是20世纪60年代美国洲际弹道导弹数的增长 概况： 

年 z 60 61 62 63 .64 65 66 67 68 69 

导弹数 :V 18 63 294 424 834 854 904 1 054 1 054 1054 

用逻辑斯谛模型 y = IV(l + e “ +& I ) 拟合这些数据，取 L =1 060. 画出原始数 
据与拟合曲线的图形. 

-I /\ )/!_ irrfr xrt ea. t t x t ✓ tt- r *. y *>. t \ -fcl* tt- 上 . A-cr / ^ \ 

丄 议 wat/U 口 J 里 I 〜卢 ， (T 丹十 1 A 万 [* 沖 ITJW 八；？ , 

试写出 Y 的密度函数并求出得到 Y 的观测值后 参数# 与 〆 的最大似然 

IP M - 

— d 

11. 设叉是打 X/?矩阵， Rank(X) = p ( Rank ( X) ^7j\ X 的秩 ）， P x === 

又叉是 X 的一些列组成的打乂 9 矩砗 ( q < p )， P 又 i 
x ( 文次广试证明 ^ 

Pr>Pr 

Mm ^ m m 

(即 P x — Px 非负定）. 

12. 设 X 是 nXp 矩阵， Rank ( X ) = 沁又 P x = X (； O 0 — 1 1 ,试证明下 
列 结论： 

(1) ”维列向韋: y 在子空间 〆 幻上的投影 e = Pxy . 

(2) 记 •，则 

，V 1 ^ 000 -1 / • 1 、 

(3) 如果 X 的第一列元素全是1，则 ， 

h ti > — (、=1，2广.，；0 

n 

13. 设叉是 wX/? 矩阵，试证明以下结论： 

(1) Rank(X / X)=Rank(X / ) 

x m y yU . \ 2 2 黑 / La \ 2 翼 / 

o ) ( x ^ o(:Txr Y = 其中 （ Yx ) -是 ： Tx 的广义逆. 

(4) n 维列向畺 V 亦子空问 n(X)^\nm fi=X(X f X)~ x f v. 

• ' ▼ , ， - -^ - 才 /- ' 一 一， ^ — — — 

(5) 为了 0是方程 
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X f XR = X f ^ 

-— - 

/ 、1 - "iTtl rJ—• BS, 、 frra • 、 #r-t •—» Jrxt 

^y A1 n 班別 pj 里；旳脚，必观且 X 观 

P=(X f X)-X f y^U p -(X f X)- (X f X))u 

其中 M 为任意的夕维列向量. 

H 考琨约來线饪悮型 

t 

(Y=6+e ' 

I A n _a 

\ nu — w 

其中 A 为 r Xn 矩阵 U > r ) ，秩为 r . 证明 (9 的约束最小二乘估计为 

^ rr — A ' cAA^-^iY 

15. 考虑约束线性模型 


( Y ^ xp+e 

\Hj3=r 

具甲 A 为满秩 nX /> 矩阵 U >/>)， H 为满秩 gX /> 矩阵（9</>)，则 0 的约束最 
小二乘估计有表达式 

..V . , ■ 

/3=^+( X ， X )~ 1 H , [ H ( X ， X )- 1 H , ]- 1 ( r - H )9) 

其中为无约束的普通最小二乘估计. 

16. 在药物的临床研究中，病人对新药 B 的 反应： y 与其对标准药物 A 

AA» r-^ XL I AA* ■> sist -A- -1Z. "T - * r=t^ \t^ rtm : VHil TT»I 上 “ 1 /\ Art XO 

mi^uK xi 汉？内八 trj 七、半工 2 书大， p 衣 w 肌 toiuitj 丄 u m^LVS： 


Xi 

1-9 

0.8 

1. 1 

0. 1 

-0. 1 

4.4 

4.6 

1.6 

5. 5 

3.4 

工 l 

66 

z ? o 

06 

^ A 

04 ： 

i ? i 

D1 

/?/> 

DO 

n^f\ 

iVJ 

/? o 

OO 

◦乙 

P o 

OO 

/? /? 
QO 

y 

0.7 

-1.0 

一 0. 2 

— 1. 2 

-o. 1 

3.4 

0.0 

0. 8 

3.7 

2. 0 


拟合>•对工1，工2的线性回归式 y = pO +供工1 +/?2工2并估计误差方差 O 2 • 
17.设 


: y , ={3 o + j 9 i xi + a ， i = 1 ，2 ,…， w 

其中 q , e 2 , …， e „ 独立同 N (0， a 2 ) 分布 ( a 2 未知），设戽，成为汍，你的最小二 
乘估计，试证明 

Var (^ ) = -~°- - 

( X , — x ) 2 

t = 1 

< y 2 

Var (^ o ) = - 、 一 ^ ~：- 

n (xi —x] 2 


m 
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社堆铥浴 必 适的铱彳+ * 社诒姐 免各东 

〆，■• ^ ia-^mu - * u ♦ f^nj • V， K 卜 • W / I VH /< O »r^ • # 

^ ' p ', f / 

18. 对第 7 题樟验 H 。： 决 t 0 ( 水平 0,05). 


19 . 诛龛人 iJl 士人的毐命 _ fe 丰鲎 h 的 4 r 命钱栝麻右钱杜羊茗.下而的 50 

- ， I / V , • j ^ V —^~ J ■ ■-• V ■ - I ^ ，>*"M » ■■— ^ 、 'V 、 ^ I 1 ■ ■ < r* ¥ ▼- 

对观测值是否支持了这种想法？其中: t 为寿命(年 ） 为左手掌上生命线的 

长麻 （ cm ). 

W '― '«■■> • ' ——- ， — 


x 19 40 42 42 47 49 50 54 56 56 

: y ‘ 9>5 9.00 9. 60 9. 75 11.25 9；45 11. 25 9.00 7. 95 12.00 

X，’ 57 57 58 、,61 62 62 65 65 65 66 

4 

y 8. 10 10. 20 8. 55 7. 20 7. 95 8.85 8. 25… 8. 85 9. 75 8. 85 

x. ftfi fifi fi7 fift fiR fiR fiQ fiQ 70 71 

« '-f v w v v f v r v v ■/ v \y vv ■ v •丄 

3 / 9. 15 10. 20 9. 15 7.95 S. 85 9.00 7.80 10. 05 10.50 9. 15 

\ J 

x 71 71 72 73 74 74 75 75 • 75 76 

r ■ 

y 9.45 9.45 9.45 8. 10 8.85 9.60 6.45 9.75 10.20 6.00 

_ 

X 77 K0 HZ HZ .8Z 83 86 88 88 y4 

y 8. 85 9, 00 9. 75 10.65 13.20 7. 95 7. 95 9. 15 9.75 9.00 


统计量 Sx= 3 333, Sx 2 = 231 933, Exy = 30 549. 75，Sy = 459. 9, Ey = 
4 308. 57, 

I 

A ^ ■ ■- ▲廬 i m » ▲ 麝 - - i 丨 ■ ■ m * 1 ^ _ - - t ‘ w - ▲ t 處 aa=g i - fi * 

m d0. 呆甘金材科贫有网柙主旻成分，为 r 採讨这网柙成分甘量乙和 X 与 
会全的膨胳系救 V 夕问 的羊系.做了一柑说胳通敎棍加下， 

^-f ■ r-w ^ ,嘩,、- I < ， J % W ~ W F ^ ^ i , *"•* *^ ， , • 

"™ I 

x 37.0 37.5 38.0 38.5 39. 0 39. 5 40.0 40.5 

•v .T*4n an ^ nn m 2 in in i y 70 

T w ■ ■ 'W' w m mm v • • ▼ 

X 41.0 - 41. 5 42.0 42. 5 43.0 

V 

y , 1.80 i. 90 2.35 2.54 2. 90 

^ ■ w <: ， 

■ * 、 

画出数据的散点图，问 y 与 i 之间是否有相关关系，如有，则求出经验公式. 
21. 炼钢基本上是个氧化脱碳的过程，钢液原来的含碳量的多少直接影 

議 ■ / * F-_»l 、 Ij / - *p*l_ J_ M ^ V ^ t ^ * _■ * # ^ _ • 1 I* > .■” - 八 * -f f ✓ n« 入 Aat. I /1 * 

脒 HT 问的长 殂 . 卜衣走呆 WTXP M XP 的俗平恢 （ E|j 芏邯 XP 科俗化元 

毕时钢液的含碳量 ) 与精炼时间（从熔毕到出钢所需的时间） . 用 : T 表示熔毕 

* f 

» 

• « 

->-Aii / jul a 八 n / v —i— ― * >• t— • 、 一 » j t\ 、 、 — 》 ■• 、 一 » t_> t- * . /.t\ i»t Lj-» 、/- 、人 ~^r 八 

恢 k 毕议： u. UL7o),y 衣不棺脒 叮问 （ 甘） . 1S.I0J : y -^x 走仿句琛饪和天天示丫 

若有，请找出回归方程 . 若测得某炉熔毕碳为 145( 即 1. 45 %)，试估计该炉 

rTrr Jrks： lr^- i-t_L «Vrt / Pea A-i- I-^ r\ r* (\ / K 丄 》 CB -L<=k 1 1 *» .4»g> r<» L. i'-rt AJ 八 y \ t \ » I * r\ r~ (\ / tea 

饥苘的栢脉叼冋〈直佰皮 w/q). 即禾想 : K 刺脉讯呵冋仕 mu or 以 r ， yD7 0 直 

信度下熔毕碳不能高于多少？ * 、、. 
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M - _ 

兮 


烙毕碳 


180 


104 


^ A 

丄 34 



141 

204 


200 

100 


丄加 


125 

235 

170 

125 


i 6 b 



155 

165 


邐 ’ 置 ■ 

丄 


160 

190 


154 


145 


丄心 


150 


編兮 


18 

19 


俗平 mx 稩烁时 |BJ ：y 


zu 


21 



Zb 


26 

27 




■29 


30 


66 


34 


116 

123 


丄 ta 


110 

108 

158 

107 


180 


127 


115 


■ ■ * ■ 
丄 y 丄 


190 


153- 





143 


100 

110 


丄 》u 


130 


110 

130 


115 


Z40 


135 

120 


CKJD 


220 


145 


fin 


185 


乙 UD 


160 


22. 回归分析常用在两个量: v ，: r 密切相关而其中一个 <； 比如 3；) 难以测 
量时，用测量另一变量 U ) 来估计此变量 （30 的值.比如，测量不规则物体的 
体积可能十分困难，而称其重量却很容易.下表为5到8岁的18个小孩的 

体重 i ( kg ) 与体积: yUm 3 ) 的数据 ：- 

， ^ 

t 17 1 10 5 1S 8 1F ； 7 11 Q in d IF ； 0 1 fi 0 17 R 

V • — - W — A. 'V' • • W 

« • 

3； 16.7 10. 4 13. 5 15. 7 11. 6 10. 2 *14. 5 15.8 17. 6 

I 

. ■■■ _ I _ _■ ■■ ■ ■ ■ 4 ■■_■ _■__■■■■_ ，_■■_■■■■■ ■■ ■■■ ■■■■■■_■ 

% 

X 15. 8 15. 1 12. 1 18.4 17. 1,16. 7 16.5 15. 1 15. 1 

V 15. 2 14.8 11. 9 18.3 16.7 16. 6 15. 9 15. 1 14. 5 

^ . … 丁 - - — 

4 

(1) 画出数据的散点图并拟合回归直线 J =^+& T . 
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( 2 ) 龙 E(vl U _0) 的95% 晉信反 I'SK 

' — f ▼才一 ■ ' | — — ▼ ， W-W ^ 一 ， • ， v M^m. - I rn * I —， 

/ A 、 ft 4 J A , 上 • - ■ fc 上 / * ^ • J_,1 A ^ A y J_ir vrt.l *—r* 

U ； 眾里 14. U kg 的小饯的评釈的 yb ^ b 顶测 12 U 日 J . 

23、某公 € 为了推销商品，研究卜告费用/与获彳 f 的丨纯利润 y 之间的关 
系，以确 w 定最佳的广告策略.调査以往的情况，有以下数 据：’ 


y 


U . 80 


15.90 


20. 20 


20.00 


18.55 


22. 20 


x 


4 


‘4 


4 


5 


5 


v 20.90 21.00 18.30 20. 70 16.10 14.75 

~ ▼ 

a ) 画出数据的散点图，试找出 y 对 4 的适当的相关关系式（研究 y 对 
ic 的一次式、二 次式; 三次式并比较其优劣） 

(2) 最好的广告策略是什么？ 
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第五章试验设计与方差分析 


§ 1全面试验的方差分析 


试验设计和方差分析是数理统计学的两个重雯组成部分. 
在工农业生产和科学试验(或叫实验）中常常要通过试验研究 

甚千个田麦对一个 r 或 玄个） 指烷的嵚 

• I v ~~> ， w I 、 I ， v i~» r~4 ， r«* v i * 


例 1.1 烟灰砖试验. 、 

甘法你士士农 L 73 J ： 余 SP 斗 t 7世伽“控 A 沿 I 田”66接油田丁 儿喀 
不 Xt T*T Wl 几 )^\ J、4 4 I 刃 vj 、 口 U / IJ TR IT ^ / 14 -!1L V 久 


料 


——烟灰来做砖.想通过试验摸索好的生产工艺以保证烟灰砖的 
质量合乎要求.质量指标是折断力，它可用每平方厘米多少千克来表 

示.析断 力絨女 絨好.试賒的目的就县桷寻求揋高析断力的新 T 艺. 

-▼ . - • -~ 7* 9 ， ， 'W ■ _ 丨 • W -» w - ▼ - W * ，， ▼- ▼ p ' ， 9 ' ~7 9 ， 丨 * ▼ , ， 

在烟灰砖的生产中，成型水分的多少、碾压时间的长短、每次 


碾压时投多少料都可能对折断力有影响.成型水分、碾压时间 、一 
次碾压料重通常称为因素，以下分别用 A ， B ， C 记之.对成型水 
分，要比较三个条件9%,10%，11%究竟哪一个好？对碾压时间 
也要比较三个条件8分，10分，12分究竟哪一个好？对一次碾压 
的料重，也要比较三个条件330 kg ， 360 kg ， 400 kg 究竟哪一个 
好？每个因素要比较的各个条件称为因素的水平（或叫位极）.在 

I W M * ▲ . ▲ • • . •- & M - * ▲ > ▲ M i . M _ - ~ -- • . ■ . • - - *• 

这个例于中共有三个因累，每个因素有三个水平. nj 夕 ij 表 如卜： 


因素 

水平^\_ 

成型水分 

碾压时间 

一次碾压料重 

1水平 

9% 

8分 

330 kg 

2水平 

10% 

10分 

360 kg 

3水平 

11% 

12分 

400 kg 


嚤 
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通付试验.益趙冋您剂口个间题.. _ 

f “ 7 ■，一 ""■—_ P - P |™| V ，4 * I I — r %^ m ^ • 

一 ^ w __ m » 量 ▲ • 牵 - • 一 - - * - ^ m » M ^ i I ■_ 时 M fc ■ ■ - * i ■ 鑫 

(1) 对指标（折断力) 的影啊 ，哪个因累重妥，哪个 H 累小 

宙亜9 < . 

: 

(2) 每个因素中哪个水平最好？ ， - 

ro\ 女 FH 垂 Pf / 丄 // 往 Aft 士证投 
； A\ ■ VO/ 订以尔 M I f 'AT-TPy/JVTJW 日 L»Atid 小 /V) 1 日 1/J 、 取 : 

这是多因素试验中比较典型的几个何题.当然，在实际工作 

r 1 • , • » t 

中因素不必限于三个，各因素的水平个数不必相等.怎样安排试 
验？ 1 如果各因素的所有水;平组合（在例 1. 1中水平组合共有27 

▼ ■ ■ ^ • • - ■ ▼ * p W - ，产 ■ ，•^ p ■ ' P — 『 ^ w 1 ■ k ，翬 ，- * ，罗 

种)都进行试验，则叫做全面试验.在实际工作中对于因素个数較 
.少(例如单因素或两因素）的试验常采用全面试验.当因素较多 

1 、 fc_ 

肘，•全面试验用得很少，因为工作量太大,试验费用太高.有射由于 

I ^ * • 4 | 

试验物资的限制，根本不可能进行全面试验. 一 个重要问题是，如 
，何选出一部分有代表性的水平组合来进行试验？这就是.试验设计 
0 &, 本章从§2起要论述试验设计的方法.本节 g 讨论全面试 
验下.的数据分析，着重介绍方差分析法. 

必 ^44* m 虫 71A. 

、 ㈢ 兀听平四乐肌脾.、 ，• 

所谓单因素试验（也 叫单因 素比较试验)，就是在试验中只 

-4^ 八 rrt -=J=^ tiA 丄 l i — I 上 i- / ^ —r- r r. 厶 A* rr~t -=J=^ Jtr^ I ▲ ttT t 丄 1< 丄一 Arfc" XA. 

亏跟一 t 囚系，取製的日的仕丁 m 牧囚系食7久于4；馆你但 w 

差别. . 

^ ^ F ••‘ • 一 • - » v rx ▲ 、 /7\ 、丨 》^ ^ t I fy 11 i A rf^ 

； :例 1.2( 饲科对比试骏） ^ 为友辰衣困机概化乔鸡；呆饼 

¥ ' * * 

右跖姐据茄闹的你術楷沏_孤叙田油财* CV 苗旌裕.缠商 M 伴栽 

yu/yi 4 /m 4^ 1=1 h v 夕 a i/xin in t^u ? *yi yu/ m lyo ^ r%K f \J4 、 f=k f \J4 ，々、'厂 i \ v « 

国外用鱼粉做鸡饲料的办法.他们研究了、三神饲料配方 ：第一 

* 

轴 I ”本+沾7白必 I .祖一 * tt IW 抽秘 机甘莊奶斗士七口 /1> 
TT 赘 KASHJ 乃工卩 ； I A=^J 竹； ， T 7 ―^ TT y^s V % 仍 W 、日1日 1 VJ . yV 工 A 44 / 

量 鱼粉； 第三种，以槐树粉、苜蓿粉为主加少量化学药品.后两 

曰 liU /»'-! TTT ikil AA Tftm ^ I l > — 1 SAt fel 企、1 - A - ^ afh Hm L A/i ^ 

TT 疋 llli IU W 巾!] trj 祈 刀. 力 di 权二 IT WJ 竹 1±: 开 抑 >目 ； J 。 丄 tTJ 从 

% 

果，各喂养 10 只母雏鸡，于60天后观测它们的重量.如下表 
所示： 


①本例取自 [7] 的第157页. 
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m _ n 

第一种 

第二种 

第三种 


鸡 



1 073 1 058 1 071 1 037 1 066 1 026 1 053 1 049 1 065 1 051 


1 016 1 058 1 038 1 042 1 020 1 045 1 044 1 061 1 034 1 049 
1 084 1 069 1 106 1 078 1 075 1 090 1 079 1 094 1 111 1 092 


在这项试验中，指标是60天的鸡重，因素是饲料，共取三个水 
平.试验的目的是要比较三种饲料在养鸡增肥的效果上有何差 
别.这是单因素试验. 

如何进行比较呢？如果不存在试验“误差”，那很简单.只要 

对每种饲料养一只雒鸡，在 60 天后称一下重量就是了.然而，由 
于鸡与鸡之间的个体差别造成较大的误差，故所观察到的数据并 
不能完全反映饲料的结果.自然想到比较各种饲料下的平均鸡 
重，从表中可算出 ：第一 种饲料下平均鸡重为1 055 g ， 第二种饲料 
下平均鸡重1 041 g ， 第三种饲料下的平均鸡重为1 088 g . 从直观 
上看，三种饲料在增肥效果上有明显差异，而且第三种饲料好.细 
心的读者会问 ：怎么 知道三个平均数之间'的差异主要由于饲料不 
同产生而不是由于试验误差所造成？换句话说，如何鉴别平均数 
的差异主要来自“因素”，还是主要来自“误差”？ 

J3&> -TOf ^f* JLX* /r** \ I ,v -Lr-—/ V Jjr^ 

达而安一 w 、 新的现 it 甘饥 刀汰-刀 

先进行一般性讨论，然后再回到例 l . 2上去. 

■ 

• >-▲ - jl r ■ ^ »^Agp a * - a t _ ， ▲羞 ▲ / a v w 、 ■ 

X 芩思一 T 囚系 A , 书 5 个爪干 , A 2 ，…，彡 Z )，| 口 J :这 
此★萆对枨烷 v 的作田县丕一炷？ 

二 ^I y^ w »-»v I i - / i'#i—I ii • 

设 A f 水平下重复进行了 r 次试验 (》2) ，数据是火 1 ，乂 2 ，…， 
: yv , 我们假定有下列 模型： 

y {j =^+eij (t = lr^9S ； i = l, — ,r) (1. 1) 

其中 {以 } 相 互独立，且 ~ 〜 iV (0，( T 2 )，£ T 未知. 

待检验的假设是： 


H a xfM —in - {is ， 

这是线件樽型 的叁数 的检验问题.第四童中已有一般理论， 


(L2) 


现在要用到的检验上来.记 
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1 

\ 

f N 

Vi 1 

f 

Y= 

: Vl2 

• 

_ 

• 

, x= 


sr J 

V 






E r 


♦ 






〆 


rsX s 


/ V AAt 曰 \ 

V-A try 饮疋 5 夕， 


E r 


r 1 ’ 


f N 

I 1 

A 4. 

1 


^12 

• 

9 e = 

• 

• 

• 


參 

• 

.1 > 

rXl 

、Gr > 


易知模型 （1.1) 可写成 


Y=X 


f 、 


Mi 


參 


lM s ) 



€ 


设 


"1 


Us 的最小二乘估计是 / h , …，么，则残差平方和 

■ " *• 


Q = 


f ▲ > 


y-x 


▲ 


參 






j 


min 2^0 — A^) 

i，i 


• fe ^ - A _A W ▲ ^k. _ 

狂 H A 成立卜的残差平万和 


__ • "Sin ✓ f 、卞 

W A = min — 洋)- 




按一般理论，在 H a 下统计量 


F 


( Qa - Q )/(5-1) 

_ _ _ _ * 

/ / .'X 

W /、rs — s ) 


F(s — 1, 5(r— 1)) 


故可用统计量 F 检验假设 H a . 


k _ # w _- ft 麄血 to M • - W 身 為、 

我们指出有下列简早公式 

Qa — Q = 


_ 

♦ 


/— 

ZjW 


y ) 


其中 


_ 
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实际上， 


y ] _ "*) 2= 2 (力 一 ％• ) 2 + 2 (%• 


故 


Q = (九 一 ）:•） 


«« 
i »； 


由于 


2(九 一 ") 2 = 2(% — ： v ) 2 + Sg —") 


_ 4 

tfj 




易知 


Qa = -： y ) 2 = 2 J (3^ o ) 2 + 2 J (3^ - y ^ 


(1.3) 


于是 


Qa — Q = ry ]( yi . — y ) 


所以检验的统计量县 


F 


(y { . — y ) 2 /is — 1 ) 

* 

_ % _ 

2 ( 九十乂 • > 2 /^(^ — 1) 


M 曰 iM663E ： — fcrinU^Ey^：^ ^rHa _ ^3L^^nJX4&^tlSi 

VJ-* ^ //C, MV 1 yj H J 4 TUT - 4 a >-v y Cj i -I ， i:hTUT/ y n 

个平方和.每个平方和都有明确的直观意义 ：（1. 3) 式的左端乃是 

• * 

全部原始数据围绕平均值产生的波动平方和，而 （1. 3) 式右端第一 

项表示由干试酴误#引起的波劫平方和（同一 7 k 平下救抿引起的 

^ ， w ^ ~ ^ 9—9 ， ■ ■ - V ^ ， » - -W ， ▼ _ ，▼ ,--'■， ，， p W ' W r »—P ▼ • f r • ▼ 

r 

波动平方和），右端第二项是数据由于因素的不同水平而引起的波 

油疋古知俯昍扁 . 甚 n u 才亡總笛 -^isf 屮益笛一撕+追次 . mil 

rr^i 1 'i r* • ，/j -sut* t <t_i \ 丄 • ^ / 'h -nm ，： / 、 i^lj >1^ —- / 、 i m ’ yvj 

说明因素的各水平对指标的影响无显著差异，反之，若第二项比第 
一项大得多，则说明因素的作用很大，各永平的影响有显著差异. 

4 

这就给出了上述用统计量 F 进行检验的直观意义. 




把全部原始数据产生的波动平方和分解成若干个有特定意义 
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的車卡知 r 甘由右 一+ 旦彳呈类 31 拍:的 3 E 古知、 :缺 白抱: S ： 此聚古知与 

m v I y^ r \ « I rj I A*=r v i Ats i /v m h ， 7 w /1-1 n 1 r \ « 

误差引起的平方和进行比较，以对某些“假设”进行检验，这种方法 
通称方差分析，是 R . A . Fisher 于1923年首创的.在具体应用时， 

常用方差分析表的格式.单因素情形下的一元方差分析表如下： 



S ■ 

■ 1 4 * lit - A -± jk — • l _ - ▲ 上童— /. 1 _* - i*m v I . t ^ Lai t . v Tt a 1 产 l _ ■ ■ 上史^ V ， / \ 

右囚系 A 对 M 的， m 姐迓显者饪爪 f a = U . Ub 对 M 的 t 甘 
古胳思佶.咖女“搿蒌杜”…於宙 iP h * .丕議朴々也不埴劣卩倌 

»-/ ■ m=3« 7 i-jl* 9 ir^ i-j- j ― ^ ru^ 1 ^ 7 i-^v 1 1 ' 1 • 1 * ko* 

' •> 

t _ _* % .龕 — A % 參 • M •鲁 ■’ to 勝/ to 參 ✓ ^ 1 丨 ▲龜 *»赢 *_ 、蠢 V 

趙过 a = 0.01 对应的 F 分布临界值时，有时在“显著性”一栏里记 

卜咎咎 aSt ^ -Sr rt? i^fe 1 i6 ^B3 -t^ P7 . iH^ Hrf ifif REt S 

_1— ” ” • ” ，， ” -v%, Al 、 /J^ r^s Jd IUK u A , ^U H J '| ， j、KJI ▲ k ^c ， 、 1K . 句 

的.若没有记号 * ，则表示不拒绝假设 H A ，也称因素 A 是不显 

龙 Aft 

-m m 

现在将上述一般性理论用到例 1.2 上去，得下列方差分 析表: 


方差来源 
因素（饲料) 

误 m 

、 ，一 i - 



平方和 

11 675 

5 569 
17 244 



由此可见，因素是显著的，即不同饲料在增肥效果上确有差 

* 

r-t ^1 _ IH* L.K. t_ k t.L ■ —一 # V 縿 丨 , jA_ * ■ JTait » ft l_ ■■ * 

m. 耽然罘二柙词科卜的干巧玛 Si ^ 于弟一柙祁弟二枰词科卜的 

平均鸡重，故第 三种樾料增脃 效果最 好①. 

• • 

. f ^ ^ ^ * 

r 1 

/"?S. vf ， / 111 > n ✓— a 、 y_ g - Jj—» #. A* y nn •■镛 瀘 上 L ^ I f • 1 _ nn _ w m 入 I.r ~» AtiM， X 

W 彐假议 U . z ; 傲坩钯 （ B | i 囚系 A 是显者的）叮， M 衣明 fl \， …， fis 小羊:和寺，开 

未指明某个 A 与某个 A 相等与否.若要进一步判别 A 与 A 相等与否，则需要学习统 
计学中的“多重比较的方法”（见 [7] 的第五章）.本书不介绍这些比较深入的内容. 


鲁 


277 





















坏雲枨屮的县.女鱼田麦试验由.么水來下的试胳汝物 r 不必祐 

Air HM 4 口 9 ^-% »^i v y^* — 7 |*JL^ ― I — f^l ^J'S I I M V ， I "I H 


▲ • • ▲ _^k 丨 i 1 & b ^ • _ • 蠡 麄 ■- — . ■ 鳥 — — --▲ _ 蟲 b _ ■ — ^ ▲赢 龜 V v to . V ▲ I 瞀 ft — 级 ■ 

等.利用线性模型的理论也可导出相应的统计量与方差分析公 

士扭丛沐本此斗 t 仗 TI 
> w 11- yv ^• 

现在来研究两个因素的试验. 

jru m ^ a ~tr A^ -Xa \rr a a m n -t^ ^ ^ \rr r> 

叹四乐 /i ^ ^ : 「小 T :/ li ，•• •，/1,;四系 D ^ I ，「小 T : l ^ ,• ••赘 


B ,( s >2. ^2). 对所有的太平细合都讲粁了 r 次试腧 （ r >2) .份 

丨 '一 % f ^ ■ ■-# y , 节， I 『 j p— | #—• | w *m v 、 r-— ， ， ■ I ' - 

A 处于 f 水平 B 处于 / 水平下指标的理论值 是/^ ，观测值是: y yl ， 
,,_ ... .. isrwn 

Jiyi 、 9 Jijr ， 1 大出 /t ： 



(1.4) 


(z = l ,••• ,5 ； ;• = 1 ，…山 是 =1 ， … ， r) 

苴中彳^)县试验误券.我们假宙它们轴立同分布.日 h 〜 N 

，、 » \ _ fV / ， ■ '， ， ■_ ， M ； I ,■ ， ▼_ • _ • * ， ，， - t - ， — ■■ - §J M 

(0， ct 2 )( ct 2 未知）. 

I * 

斗了乂 欠 ffl • 好毋拉 6ft 影 mfn A 

4 >M 1/1 TT P 尔 ^ J JH KJ、 n _"J • . >C 


—丄 

UJ 


IJ 


ai 






A * 


- 5 


r 

s 




() = 1， …“） 


Xij —fiij — JU — at — ft 


则 


、 y.ii =/i + ai +.ft + A。' (1.5) 

5/5 t 

2^ = 2 ft = S A o = S A o =0 (1 . 6) 

*•=1 v=i i=^ t.=i 

/ — _ 鉍 / 

丁成毛山 一 主祕祐：水士 “此 m ” o 主 ^ d 66 祐 ： 

，| 、攀书 UL| 叫 >PC ， J 、 八 PV ^ ^ I /JV 丁 py I 卜厂 TJ >j 仏， 4、 u RV 方 jy 

个水平的“作用”.通常称 《, 为水平 A , 的主效应，汉为水平 B , 的 

， -- ， - - - ^ * - - ， % j ^ ~ " - ^ ~ 

主效应， Ay 为 A , 与下的交互作用效应.很明显，若; W =0( — 切 

i . i ). IDll 

^ y j ^ 7 〆 、豸 
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fM^fi + ai +ft 



汶妾昍女田表 4 的 A . ★巫 扫田麦 R 的 R . ★萆下的裡汾佶 （ 直 

'k 、 l-j— V^4 * * l-*v * * l I v l=—^ -^J'S M v J ， "J 、 I I l~w ，- r Ui M~U 、 > 、 

身詹 ■■■ 、 — - ▲ • 赢 ■_ • h — - • • v / •备 ■- ▲ 在 m, m • I 臁 — • — • ▲ 鲁 

值） nj 表不为因累 A 与因累 B 单个“作用”的叠加. 若; l lV #0, 则从 


(^ c；、*n na 奢 ^fcrna 妾 r 科银 拉姑控 A“>tfc 田 ” 丈热 iin 社斗苗木 

\ A • ^ / ， H ，^ X X /\J gt4 IAI、MV VJ 、 口 I r / IJ ， I ， WG V-l /；； I 

因素“作用”的叠加，而因素间有一种内在的联系在起作用（所谓交 

-ft /fc m \ 

儿 fF > m 八 

待检验的假设有 


Hi : ai =a2 = ^ 9= a s = 0 (1* 7) 

Hn ， R、 = R 。 =… 1 ( 1 . 8 ) 

- id • 广 1 广心 广丨 _ 、 — ， 一， 

H 3 : An =Ai 2 =^..=A a =0 (1. 9) 

H x 的含义是因素 A 没有影响， H 2 的含义是因素 B 没有影 
响， H 3 的含 义是: A 与 J 3 的交互作用不存在. 

先用线性模型的一般理论导出各个检验统计量的抽象形式, 
然后利用平方和分解的手段找出统计量的具体表达式. 

将 {3^ } 按足标的字典排列法写成一向量 


ini 、 


Y= 


yin 

參 


I ystr ) 


记^可用参数^心爲山表示出来-记 

w ={ e ： 参数满足 a .6)} 


rrr r a ^ Aifc a ， i ^ \ tl / i n \ i 

yy i = u ：： 爹双 f 两疋 、丄 • n) 


W 2 = { e ： 参数满足 （1.6) 及 （1.8)} 

* 

\ 

I 

^ ^ k . k .A • W ■ ■ i ^ _ - w ^ _ — V 

VV 3 = {^： 蔘数满足 （1.6) 及 （1.9)} 

- r ^ W 的維粉且 w W 的她粉且 n 9 V it W h 今讲甚夕 ▲ + 

T ， W V ， ' 丨 ， TW I MV t \ ^ 丄， “ ， "|JL* ，， 1 ^ 


各 ， Y 在％上之投影为 & G =1,2,3). 

Jzr r \ — II v — a II 2 r\ ― 11 v — a II 2 八 
W—1| J- Co || , W,- — I i Ci || > 



(Qi — Q )/(m — Qj) 

Q / ( n — m ) 



从第四章知，若成立，则 Fi 〜 F(m — qi ，w — m ) ，故可用统计量 
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F 給聪假份 F 7. 

—z ■二 il^v • 

剩下的问题是如何计算 m , q l 9 q 2 , q z 及 Q，Qi，Q2，Q 3 . 


ji 


理 




设 A 是 >! X 夕矩阵 以是夕 维列向 /量， 若空间V 


存在 w ，使得中的每个向量的表示法是唯一的（即对任何 

~广 '了 门 ~£r _ . Afc 彳曰烏 —— A .\ IHi! T 7 AA Zrit 日 x. 

v , 只书一 ’「 w utM 守 八 wv ，只 _j v trj 亡田双 疋尸 • 

证明：用反证法易知 A 的各列线性无关，从而 V 的维数是办. 


证毕. 


由干 W 由的 A WT 唯一他由糸物 r " .… .n … (I ••••fl 

!*• ^ I ^ V ^ ^ ^ KM jS^ 卜 7V^i7 7 \^s — 1 7 7 


* 


A 


Is — 1 


，么 21 9 ** m — 1 f t 


1 表示出.故 W 的维数 


m=l + (s— ； l) + (£—l) + (s — 1) (t — 1)=5^ ’• 

W \ 中的芒可唯 一 地由// ， A ， … ，3 t - i ， ku …入,-。—表示出，故 

■ V ™ 

= 1 + (^ — l〉+ (S^-l)(Z_l)=5i — （5 — 1) 

同理知 


q 2 — l-\-(s— 1) (s — 1) (t — 1) = st — (t — 1) 

W 3 中的芒可唯 一 地由 p，ai ，… ， a 「 i ，仏， … ，译 -i ，表示出，故 

剩下是求 C^QpQnQs. 用平方和分解法，方法十分初等，但表达 
式比较繁.引进下列记号 


r 


At .. 

^ y 


V 

jLJ 

k==l 




Af . 


tr 


2 


Af ... 


y=y 


str 


2 

ifi.k 


yak 


其他记号 y ^ 等的含义是类似的，不赘述. 




— ^― a：)] 2 
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^ — rr 

X i J 

i ， i ， k 


V 


+ E 


3^ 


y 


At 


h 



/ y d — u~ ai) 


k 


Zj K y^ k 


yir 





: y 




4 - . 

1 / A 


y 


ft ) 2 + E (歹“ 


由此可见 


于是 


Q=^(yijk — yi ^) 


i,k 


Qi = Q + 2( 歹 


50 


i ， i，k 


Q 2 = Q + -50 


i.uk 


d 




Qi — Q=tr ^ 


ft ——A 




y-r + 歹 




V 


y — a 




V 



r- 


/ 


Qs = Q + U (〜•— i ••一 歹十 + 歹) 


y 


a 


s B = Qz — q =5 t 2 (歹 •; •—歹) 


S A 


d 


XB 




Q 3 — Q = r > : (y t>. — y ^ 2 — Sa — Sb 


最后一式的理由是 




A A A fl 

yij * y 


VJ 




A ft - 禽 ■ 屋 爲 ■ 

yi- y*i- • y 






“ j，k 


uk 


+ ( 歹十 —50] 


S (〜 


yv 


y 


… + 歹) 2 + 2 ( 歹 


50 


+ E (歹。 


3^ 


V 


\ i,k 


Saxb + s A + s B 
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现亦 


M 


A 


m 

w m 




^ j k k 蠢 身 _ ^ 身■-身 i & ■ .w 

m = sKr - l ) ，故有计昇公式: 


—-A4* 八 4*r*. rzti 上 m —f— 1 

刀发 TTI/T 衣训 r : 


Sa/(s 一 1) 

Q/ stir — 1) 

Sr /it 一 1) - 

w 

Q! stir —Y> 

Saxb/ (s — 1) (t — 1) 
Q/ stir — 1) 


方差来源 


平方和 


S A 

Sb 


AXB 

、口 

跃左 


S A 


V R 


自由度 


5 — 1 

t — 1 



str 一 1 


平均平方和 


Sa/ (s— 1) 
Sb / U-V 



(s — 1)(, — 1) Sa V n /Cs — 1 ) Cf — 1 ) 




显著性 



注意 

* - 

Sa ~h Sb H ~ Saxb Q = > : (yijk — J ) 2 
等式右端常记为 s T . 

例 1.3 在某橡胶配方中，考虑了三种不同的促进剂、四种不 
同分量的氧化锌，同样的配方试验两次，测得了 300%的定强 
如下： 






问： 氧化锌，促进剂以及它们的交互作用对定强有无显著影 
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Dial ? 朴々 县士奥 子后？ 

'v g * II % i /一 ，只 • 

* 

t V . A ■*■ i b «. _ A A ^ V w a ▲• • ± __^». 鼴 ► i V ^ ▲ A % • • 备 ▲ 

这属于两因累全面试验的方差分析范围，万差分析表如下 


方差来源 

平方和 

自由度 

F 值 

显著性 


■b 




HB 

mBM 





WBM 

\y 




■n 

12 

■HI 



■BOH 


■m 



M - -5S^ TT' 八 -fe' V*A ilA* 田 Atr 曰 tt 4 / o -i o \ _ 户 n tt 1 / o -i o \ — e r\ 

r tt^ip 奶 ifm 介 ia 疋 r o . 99 ，丄厶 y — y ， f 0 99 、 o , 丄厶 v — u ， 

F 0 . 95 (6,12) = 3. 0, 故 A、B 都是高度 显翕的 （用 * * 表示）， AXB 

& -r* 口 -±tr AA» 4A. DX ya 、朴 tViI /f> dil7 曰 庙 A At CXJ 虫 7WT 

疋1、亚者 HV • 伏 'RJ W 肌， lAt 32T JTU 亇 M 羊 l/PL tT >K、 里 flP 疋 1 里女 ffV d 乐，門 

者相比氣化锌筻重要一胜 .ik 两个因素的交互作用不存在，相应 

■ 冒 ，— —曹 p ， ■ p — 一 , • •«■ •- w _ -- _ , , , v , — -^r w » ■▼- 

上 A* TTt . > . -r« i—I i=t、a -^ju j^u -r 丄 i —"丄 \_i* «_L t-^-t 、 i" v^tacr -r« 、 i=t ~x^ 卞丈八 、/• _Lr-r 

的卞力 W 只足 误宏的一押 汉吠.込时，円付谈叹 W 俠宏呗甘升 ，十日 

协的白由麽也合并 .W 椹高分析的嬙庶.汝讲后的卞券分析恚 

，•• ^ 9 1 ， ■ 1 r—f ， I , ▼，， 1^ B ■ v ^ ^ ， W-^9 r-r ， ， 1 m m ， ▼ V f 『 F ， 

如下： 


方差来源 

平方和 

自由度 

-■! _ C- -- 

F 值 

显著性 


56. 6 

O 

u 

no q 

LiLt* U 

h 

关兴 

B 

132. 1 

3 

35.4 

* * 

1 祖 m 

v 、 / * - 

H 

*• v 

1 ft 

， 

- 

总和 

211.0 

23 

P< 

■ ■ 


因素 A 、 J 3 仍是高度显著的. 

w I I 、 _L 、八 —j^ <X4 nt -a** -r.-* a: * i~rt ^=* 人 : t ： > — Q. Tt 八 H > ■ -XJU / \ J*r* cTr^ rr-r 上 A* > ■ 

以工巧化』半囚系邳网囚、系 : 王 KiA 製的刀宏冗饥，肌用的刀 

法可椎广剞审名闵麦的令而试脍的数抿分柝卜去.由干公式士繁， 

， ，> ■ ■ f ^ 一 _ —— ^ r ， ，-#、 r~» 1 * r ， f w w ~~9 ， ▼ ， • ▲ _ _ ， ■ i ， _ t f ，，，， ，辛、 ' 

* - 童 ▲ t 冒 1 , A # 1 • U - I 、 、 . • ■ • w^ JL 

使用饥俚敉小，这里小介绡 j • 


§2多因素试验设计问题的提法与数学模型 

前面说过，在试验工作中若要考察的因素较少，可采用全面试 
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胳 . 刖么田麦的 研右 ？ k: f 铂合规宕挑试胳当田麦坊衣时.汶轴仝 

•*=4* 7 — |- 1-^1 A 、 p-* V // I N 、 | *TXX |~| Hr 4 II '^L=£* • - 1 ¥^—4 ^ -i 7 | | —L- 

面试验就不 合适了 ，这时只能从各因累的所有水平组合中挑选有 

你主純 66 一敢从 4 仕#奸必 /B 找她油 EIH9 总一轴她选故且一祉试 

I \4>i^ ijimj 卩卜刀 ji4L n ㈣ 娜 • 心 rr piiw/Ci: tv J7u 44^ <iyu/e, u 叫〜 

验设计. 


-U- "7^ nt 办 、 tV 人 • 、二 I m?r ^u a 、 i 泰 w -kn ^-p> nA. i\n m?r +b 士 认业 A/t 4^r ^ 

yv j wr 九込 ri w J?ei ，： pciu 而女 jgia 独 ihissj 庇肌 ra =i trj 双子 • 

模型. 


假如我们要考察 m 个因素 P \ (有 h 个水平）， F 2 (有 52 个水 

-^1^ ( ^=t c ~l\( ~y ^- 、 7rP 宜 ~kiT n 6^1 W^. Dial : 田 1 *9 - •••_c. "fr^ 

4 /_7 7 v rj ^ m i ， j 、I / >r v J xrv jo kj.» ,v^ m v ><i>^ • / ig 丄 ？《7 ,7 ru ▲ j 

的巧个水平 ( s ,>2) .当 h 取水平 / U ， F 2 取水平 A 2 ，…，取水 
平; U 时指标 a 的真值,(理论值）为 aUpAz ，…， A w ) ，注,意真值 

{a(A*i* … ， A~.) ;. l^A..^5. -1 ^l.••• ， m } 共有 Si ••• s m 个，它们县 

1 ' - - * ，斤 零 知 •* K » r ▼ w j ~ J ' ^ ^ w ,， x b /#«> ■ ， f 9 ^ ^ 

客观存在的、但我们却观察 不到. 我们能观察到的是观察值 

U 


-\K z=: n ( Ti . *•••_! 、 -4 — d?. 

• ^ A 1 *" A m ^ v/v ^ 7 ”、 m ' I "*A m 

这里^^是随机变量旧值是心一般假定它服从以⑺，〃 2 ).如何 

1 ft% 

根据观察值 {： y A ... A } 来估计真值 a ( Ai ，… ， A OT ) 或研究其性质，这是 

1 m 

很重要的 问题. 

-要对所有的 水平组 合都做 ik 验取得观察值，_代价太大了，实 


际工作中常常不允许.故问题的提法 是:从 所有的 s lS2 … Stp 个组 
合中合理地尽量少地挑选一部分组合做试验，然后利用得到的观 
察值推断出真值 a ( Ai ，… ， A OT ) 的值或性质. 

真 tff 函数有些什么性质要研究呢？引进必要化定义.令 




m 


2 a Cm ，…， a m ) 


TT 

丄丄 


又 1 ，… ，久 m 

s ； 1 m 


M t 1 % 

^ VA t y 


Si 


m 


TT 

- A . 


Sj 


A 


. s 

•， v ~ l， A ffl 


_ / ^ 、 \ _ r% 

a KAl 9 mmm jA m J — po 


,k 


m 


參 
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(z = l ,••• ， m ， A: = l ， … fS { ) 




SiSj 


■■ I ' 

1 U A1 


2 

t -1， A *+1 ，…，又， •—1， A )+1 





尽 ( Ai ) — Pj ( A >) — Po 

t 

(i < j j ，•••，〜， A 7 = l，•••，〜) 


当时，令 

Rn . A - ) = Ri ： ( X : • A .) 

^ J 、 r '•表 X w J ^ Jl， >» »y ，■- 

物 o 斗奸於瓜1、+1、^1麻/17 ... TT … ... o \66 一胁亚 

U、po yv tx. K| I^J AC2i Vi 1 , ，乂 m ， J1 ,， 9 o m j /JK I ^ . 

Aa ) 叫做因 素 R 在水平 a , 时的主效应， { au ): a <= i ， …， 

、 mi f t\J. 上 x JUL —J— 

Si / 1 W ^« 的土双 M . 

在水平 A , ，因素 F , 在水平 A , 时交互作用效 
应.的交互作 

I 倉 ^ tew ^ • % • V .、 •奢 、 • 倉 I 

用 效应. 上还效应（包秸一般干埒）共有 1 十 & 十…十心十2>七 

i<j 

个，都是试验问题本身固有的，与试验如何设计无关. 

注若对于 A ,. =1，2，…，5,•及 A ; =1，2，…， s ; •，& • s ， 个值 ( A t _， A ，.） 不全相 
等，则称因素 F , 和 F , 间有交互作用，也说 F , XF } 存在.相反情形（即 
戽 （ A ,， A )) 三 const (对一切5,，5)))，则称1 ; \与 F ; 间无 k 互作用，也说 F , X F ) 
米存在.二因素间交互作用存在的直观意 义是： 二因素对指标 a 的综合影响 
不等于各因素单独影响之和.例如，在农业试验中考察氮肥 （ N ) 和磷肥 （ P ) 
对大豆产量的影响.氮肥有两个 水平： ^^=0( 即不施加氮 j 3 E )， N 2 =6 斤（每 
亩施加氮肥6斤 ①）； 磷肥有两个水平 =0( 即不施加磷肥）， P 2 =4( 每亩施 
加4斤）.两个因素共有四个水平组合.在土地情况大体相同的四块试验田 

. h 抽+百 . 毎 ifrm 对命一抽“★取铂会”.刖一轴倫 HP 古才 mim N , P , 对命 

-a— r i | ^ 、 -LT- 7 *—r *^v ■*■j ， -L^* I I I i—I 7 ^-r I r /v ^ * ' i * c /-i^ 

的施肥方式是，不施氮肥，只施磷肥 4 斤/亩.设四块田的大豆亩产如下（单 

位：斤> 


①斤为非法定计量单位，1斤= 500 g . 
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N \ = 0 
N x =6 


400 

430 


450 

560 


从表中看出，只施 4 斤磷肥，大豆增产50斤，这反映磷肥的 作用； 只施6斤氮 
肥，大豆增产30斤，这反映了氮肥的 作用； 既施6斤氮肥又施4斤磷肥，大豆 
增产了 160斤，它比单独的磷肥的作用与单独的氮肥作用之和要多出80斤， 
这体现了氮肥与磷肥间有交互作用. 

/•‘ ■ r - jl J / # _ 、 — ## - Jl rii 上 L ^ - _ ■ 

夹似地，获11』迚 nj 芩思二个囚累问的又立作用，四个囚累问的父及汴 

用，….大量实际经验表明，在大多数情形下，三个或三个以上因素间的交互 
作用（称为高级交 i 作用）都比较小，可以忽略.甚至某些二因素间的交互作 
用也可以忽略. 

要注意的是，这些效应之间有下列关 系式： 

( a . )=o 

/ _ M ^ ~ ~ y - 

K 

ZjW 入 i ^J ) = Zj^j ^=u 

故独立的参数个数等于 

m 

1 + 2 (A — 1) + 2 ( 、 S i — 1) (〜 —1) 

1 

试验工作者关心下列一个或几个 问题： 

(1) F , 是否对指标 a 有影响，即问巧的主效应戽 ( A ,) 是否对 

.J^TI ^ _ —t— o 

—— w Ai —— 忏八 r 

. (2) F , 与 F , 是否有交互作用效应，即问 也 （ A ,， A , ) 是否对一 

^TI 、 、 l_ V . £ - 

A, ^Aj 一忏人 r _ 

(3) 怎样估计出 A ( A ,)， A ；( A , , Av )?. 

'• | *V - J ' - 

/ J 、 上 》 / ^ 丄 I 、 》I _ / tv 上 L I * TTf Al-» A/. 4 art 丄 I 、 w t w 丄 

卯柙伐 出忧;艮的爪 f 组甘 Uf ， A 2 ，•••，“ ） ，即伐 m h HV 
7fc 丰； L* . Fo 的 7fc 平 h* . ••• . F 的 7k 率你思指标 Z7n* ••••• 

I 7 一 “ "V '-#， I 7 7 — m i »» m 眉 w -4 1-» r-4 w w 、，》i / 厶 / • 

A * ) 尽可能的大（如果指标 a 的值越大越好的话）或尽可能的小 
(如果指标 a 的值越小越好的话）？优良的水平组合又称为优良的 
工程条件(或称生产条件). 
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h 沬问丽（ 4 彳 就县丁耝 卜的 畏优仆 IH1 丽.简稔仝茴优仆问藤 

― I— yNO^ I V ' * / r A7\^ ― " I—L. _I— •-• V IX U I U I V 7 f >~vj iy _t— / ' 'S \/ U I JK, -f •. 

v. * * l a M A _ m m ~ *. m i ‘ ^ ■«. M ▲ *. _ _ a. » A m _a. i W — -a 

这是买际工作申（特别是工业试验）最常遇到的.而上述问题（1)、 


ro\ 门、 


Bill 且 H 砂 731 ：命 cb 杏 m 66 gTfeig^Tf 欠水 FH 妾广為搞甘此方 

7^4 /^^-^ WX ^ru i ' TV ^Ui ? 1=1 l-L J^N v'4 TT I p 尔 ' Ci J 口 不 t 人 

互作用）对指标的影响规律，认识客观事物，也能帮助寻找优良的 

-I- At M* i、：n m?r / i \ iVrt / o \ i\rt 賊 / 。、人 XAt m 、 -i-c fct 人 a 

-L>I3E^1T- 丄乂、乙 7 百 T 小四承 TTIVf IHIJSS . 王网 

优化问颗与因素分析问颍二者有密切联系伯侧重点县不同的.何 

謬, _ w p ， , ▼ 9 w ^ -w 狀, , ▼ , ^ ^ •■ ■ _ ，， ，， 丨, •零，, ■ ， , ▼，- ■ "W 


者作为试验工作者的首要目标，对选择试验方案（即试验设计）有 

4 

很大影响. 

大量的实际工作经验表明，若以全局优化问题为首要目标，则 
在制定试验方案时可以大胆忽略因素间的交互作用，同时安排较 
多因素进入试验，采用正交设计或均匀设计可使得通过较少的试 
验次数找出比较优良的工程条件.（当然，所找到的“工程条件”一 

不一宙县蜃优的 ） 甚 W “ 田麦分拓 ^ 为首萆日标__#制宙试验 

i —T>^ p/ U V * ^ ， i—l » • t /"# 1/ p ¥ »— I *— » _ ■ * ,r* 鏵 ** 

方案时应考虑因素间的交互作用，特别要注意某些二因素间的交 
互作用可能存在.此时，正交设计仍是制定试验方案的重要手段. 
限于篇幅，我们重点介绍正交设计的某些基本知识.至于均 

勻设计，可参看方开泰著《均勻设计与均勻设计表》(科学出版社， 
1994) 或 [20] •① 


§3正交表和正交设计 

正交设计是利用一些特制的正交表来安排试验.我们先介绍 


①正交设计和均匀设计都是特殊的试验设计.试验设计的一般定义可如下叙 
述.设要考虑 m 个因素 FoF 2 , …，某指榇的影响，其中 巧有 s ,_ 个水平，分别用 
1,2,-, 5, 来表示 ( j = l , 2, …， m), 所谓一个“试雖设计”就是指明 m 个因素的哪些水平 
组合要做试验，还要说明试验的重复次数.换句话说，对每个水平组合 （ A ^ Ah - SAm ) 

Xm V_IX n 人上 Jt=e \/JL^ ibx. / « * « 、， -41- Mr \ \t^ ✓ » » '、八 n_L n4> -L« 

规疋饥里及队奴 nKA \ , A 2 ，…， Am 八井贝•彐 nKA \ ，/ 12 ，…， Am >» = U P 、 J 思 坏有相 

应的水平组合 ( A ^ h ， …， A m ) 不进行试验.从数学上看，一个试验设计（或试验方案）就 
是一个非负整值映射 n ( • ，•_•，• ） .若 n ( A ! ，…， A m )< l ， 则称试验.是无重 复的. 
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7F 右志 

II* 今 、 • 

设 m >2, 5 l ，&，…， &是、 w 个不小于2的正整数. 

1 路 ifeprrc*:,A 一 / 置《 V - - wire 六主 

AC 入。•丄 WT^lFP /I— \A{j JnXm 7E ： ^ 1 八 M 八八。仍生 JJ - 人 >PC 

(记为 X … Xs OT )) ， 若它满足下列 条件： 

，1 \ « ✓-r / -I ts 1 ^ -I \ 

Ao t \ 丄，乙 ， “• ，〜 厂、丄 \ mj 一 

( 2 ) 对伴何 11 < T 7 o . z / ^ 11 • 2. * 4 * . s , 丨 • 7 /A 11 • 2 • … • } 右 

' _ , ，- V I-** _ 4 k/ 1 、/ 4# ，▼罗 \ — , 一， ， /冒 \ _ , — ， ，一 ） 2, 


# {/:(A t>1 ， Xij 2 ) = iujv)}= - 

s u # s h ;• 

■ X ' u 

这里 # A 表示集合 A 的元素个数.当 h == s 2 =^"=^„〒 s 时，正交 
表记为 (/) ，当办= s 3 =…= 5 m = 5时正交表记为 (h X 

貧 


常用的正交表有 L 4 (2 3 ) , L 8 (2 7 )， L 9 (3 4 )， L 16 (2 15 ), Lie (4 5 ), 
L 18 (2 X 3 7 )， L 27 (3 13 ) 等，下面介绍 1 4 (2 3 ),卜（2 7 )和 L 9 (3 4 ), 其余 
的表可参看 [1] 和 [5]. 

表[ 4 (2 3 )是 




-I 





v 






表1^(2 7 )是 

/I 111111、 

丄 丄丄丄 丄丄丄 

1 1 1 2 2 2 2 

1 0 0-1 1 o o 

丄 乙乙丄 丄乙乙 

1 2 2 2 2 1 1 

Z 丄 ， Z 丄 ， Z 丄 Z 

2 2 1 1 2 2 1 

9 9 19 119 

V LU LJ LJ J. X LJ J 

\ 

表 LJ 3 4 ) 是这 样的： 
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构造正交表的方法多种多样，有些很容易，例如 L 8 (2 7 )， 

. ■ 

L 16 (2 15 ),L 9 (3 4 ) ;有些则比较复杂，例如 L 12 (2 11 ). 有些参数对应的 
正交表是不存在的，例如没有 L 36 ( 6 4 ).构造正交表的一般理 
论见 [7]. 


我们指出，正交表经过下列三种初等变换仍然是正 交表: 
①任意两行互换，②任意两列互换，③任何一列中将水平代号进 

V —* t _ JU _ 鼇 ■ ft ft > f # ■ ■麯 - . I -* ^-i 多 t f . 、 * - j — — ft ^ • 

仃置俠.囚此;冋型的止又表是很多的.例卯 L 8 U ) 句很多张，，上 

面所列的是其中一张（叫做标准表）.值得注意的是，可以证明所 


▲ b 泰 ■ k. fc. ^ » • . — ^ tow — ▲ ▲廉 秦 • • ▲ 办 - - 

有的 L 8 (2') 经过上述三种变换可变成上面介绍的那一张，但 
L 16 (2 15 ) 就没有这种唯一性. 

如何利用正交表安排试验（即进行正交设计）呢？我们只介绍 

T" rfer m 虫 iVn 六 "TT /^f P4 A/t J£4 O-P >4 -丄 /V 被 M : ZT irfev 六 

/m 承 I 口 trj 旧 ， WiP、J 刀広 I 刀 ^ 网平.王丁 5WST 、 乂 

互作用的情形如何进行正交设计，方法比较复杂，我们将在本节的 

I » t=^ mi* /▲* 八 A-rt I v r —t I -#■>-> 、 士 - *4^. 上 “ -Ar*. M* ^44->* A-^ ~z^ Itrrs -M. -r—*■ rr-> 

木用阶 1D「 绍，以引胚谈百的 辻思. 右安更岁 』 牌号跟父凡作用 

时的 TF 夺份计 .请卷看「 201 、「 21 ~ ll &「 7 "L 

- ’ _ , ，■— •—• — _ _J ，匕 — 一 j • p ^^i U- ， _l " 


W t M. i—^ W M . t ■ 1 ^ ^ » 一 

从一个具体例于谀起. 


例3 


烟灰砖试验的正交设计. 


继续例 1.1 的讨论.对因素和水平均用符号来表示.共有 


+ 因素: A (成型水分）、 B (碾 ft 时间）、 C (一次碾压料童），每个因 
素取三个水平 .A 的三个水平是 :A\ (成型水分9%六 A 2 ( 成型水 
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斗 f F # 刑 7 kr 你 11 W R •的二 + 巫县 .R rss Fk HTH ' a ] 

/V * v / v x 7 ▲ ▲ J V J 、 /V ▲丄 / U M V - ~*- I / J 、 I I 、 * 7 »^ /—^ ^4 I ’4 

8')，3 2 (碾压时间 lO ')，^ 〆 碾压时间 U ' hC 的三个水平是 ： G 

/ 厂 fcwJ It* O O 八 1 \ / v£*« / WJ I r * c\ f> r\ 1 、 / vA>* / WJ It* 4 八八 1 _ \ 

、一队峨庄 Kg ； 山2、一队贩 压 60 KJ Kg ； 山 3 、一队贩庄 斗 UU Kg ；. 

所右的 7 k 平细会右27轴.加佰诜出右什卖桦的一 / h 部 4 Khk 

，，* ■罅 | *^X_JU p-H I 一 • I I / I 碲 _ _ ■ I -J I 'M " I—^ ^ w 

如 9 种）进行试验？可用正交表 L 9 (3 4 ) 来实现.将三个因素 A 、 B 、 

r 械 /X 士 fr 去 T ,o4 、 A/t 一人 Xil L h^\4»rt Htt 、 b44r 去地 ' O O TTtl L* 咖油 

i wb I5c^xi3：^9 vo ) trj^ r^j 丄、厶 、 o : y_j 丄，！ wj 取 l 

得到一张试验计划 表：只 要记住因‘素所在的列中的数字代表该因 

f i. I . . i t 鼻， >*l_ f „ J^A* — V — t \_rx —A 丨丨 — _ ▲ r # JUA* ^ ■ * fc t rt m > e f ▲ tttL^ 

系的 水于. 例卯弟 i 亏试骏从表的弟1订 i i i 恃到，即囚系 A 取 
1 氽巫刖 F # 刑氽 从 Q D /^ 田表 R 劢1 士巫刖 碾陌时问劢8从蚀.田 

▲ ， J 、 I •"V M/^k ^ / yj 7 ^ ^T/V ,4 、 I #^r »r^V /—Li r-* g I -TJ *T/v w F ■ 7 |^| 

素 C 取 1 水平即一次碾压的料重 3 奶 kg ; 余类推： 一 共9次试验， 

分禅且 11 0 7 W ： 厶口 ArhJiisjb 山 iVi 古你生 A ** 加 ZL 

j^i/iyL7E：/yv 打小丁姐 口 "r ji^uu pv^r i 、双 1 工 口 pyi• 

试验计谢与试验结果见表 3. 1. ' 

表？ • 1 


列号 

试验号 


成型水分）（碾压时间）./一次碾压料重）折断力 



1(9%) 

1(9%) 

1(9%) 

2(10K) 

2 ( 10 %) 

2 ( 10 %) 

3(11%) 

3(11%) 

^ r ▼ ， 

3(llK) 


1 (^\ 


2 ( 10 ，) 

3(12’) 

1(8，） 

2 ( 10 7 ) 

3(12 ，） 


1心、 


2 ( 10 ’) 

3(12') 


1 ^ Q Q A lrnr 、 


2(360 kg) 
* 

3<400 kg) 
2(360 kg) 
3(400 kg) 

i • 

1(330 kg) 


3(400 kg) 


,1(330 kfir) 


2(360 kg) 






怎样分析试验结果呢？首先想到直观分析法.以成型水分为 
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你 I .抗抱二小71<：笨下 的巫也拓 1 胳士 4 VSII 筲.屮 1 ★巫下的車也折 

IX ^ 7 ^ I TJ ■* I ';、 I I *-• V I ^ 'V 4/1 1 -XV 4 Z7T~ I 、 I I *-• V I 4/ I 

断力是 17.6,2 水平下是 20. 8,3水平下是 22. 8,这就是说，成型 

士 /V 田 11 。 / 县 * z 县 Azd^t; 县若 66 相治 c ： q ， 士 it 若、 • 种本 iMnrnrf 

/J V J4 / u 丄丄 / U XIX >J > W. >J MV -tK ytXL 1 口 & KJ.XJ\ 1/x. / t /'U 4 WC/-X5. H'J 

间，三个水平下的平均折断力是 20. 7,21. 1,19. 6,故碾压时间取 

1 a 八且士 7 士 it 必曰 1 :: 口 -I* ra nr i^t/t it>r 击一人山市 

丄 ^ 万取 xr ， t 汉左疋丄 . 力 、 j 1 tAwtvoicpj^ 里，二 ’r/j 、 丁 r avn^^rj 

折断力是 18. 8,20. 7、 21. 9,可见一次投料400 kg 最好，极差 
是 3. 1. 

缤卜所沭.右 T ? il = 备结里_ 

，，，， * -，， I ^ fcM f I «# I ^ «# 垂 4 1 一 p—f ， I ▼警 


(1) 成型水分影响最大，其次是一次碾压的料重，再次是碾压 
时间. 

I 

(2) 成型水分是11%好，碾压时间是10分钟好，一次料重是 

400 kg 好. ' 


(3) 最好的工艺条 件是： 成型水分取11%，碾压时间取10分 

钟，一次料重取 400 kg . 

* 

值得注意的是，所指出的最好工艺条件并未在所进行的9次 

i 

\ ^ J - 11 w T*tn 

说诞屮 m 现. 

读者自然提出 问题： l 9 (3 4 ) 表的好处在哪里？上述分析计算 


# * 一 M A_▲ • 

的理论根据何在？ 

下面对多因素试验进行一般性讨论.首先介绍如何用正交表 
安排试验，然后讨论数据的分析方法与理论基础.本讲义只讨论 


最简单、也最有实用价值的情 


« v ^ 

j]y 


可加模型的正交设计. 


什么是可加模型呢？考虑因素巧（有 51 个水平），有&个 

r? / -tr 人丄 \T7 \ rr-l* 44fk -kn &A n 占 tO < / ^ \ 士 

f" m s m 1WT 小 a tpj w|Rj ，/ tJ avAi ，…， /u / 衣 


JLa XTT 

/ j^^r 


示 P \ 取水平 A ! ， F 2 取水平 A 2 

/ • • * 、一 I • -¥**1 / \ f^rw* _ 

aui m 2 . — 


• • • 


, F m 取水平时的直值，若 


fl ( Ai ，义2，…， Am ) = a 。 + 〉 j dj ( A ；) (3.1) 

7=1 

则称因素 ^ 适合可加模型.可加樽型的直观意义是: 

， - w w r ， ▲ - ， f f W w W ， ， ， — w - m^r ~w •- ^ - —• - ， — — , 

各因素对指标^的影响是各个因素分别影响的叠加，因素间的交 
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互影响可以忽略.可加模型当然是一种特殊的模型 ( D ， 但实践经 


验表明，它广泛地存在于实际工作中，而且即使实际情况不完全适 

八 7TT4m 进 Tffil /口论 mTTT 4m 拽 Tffil Aft 7IT 六以 1^4* 电幽杏 j+f 7FT4B 山 
口 M J "Mm 出 > |±±7N/TI M J /JM 伏生口 ’J JJ- 入 k>C H >C. Hh 叫进币币 U2* "J I 寸 UL| 

有重要价值的试验结果，特别是能找到比较优良的工程条件. 

TW? .Vi- XA. HfcH 八 la —tk / o -i \ -fe> -/r* mil -t-* h/^ /nr- 一 iM At t$U 

” 安仕思 的定，石 or 肿:丄；仔仕， wu 匕个限一， ih 仕 r ^ u 求 rt 

下就睢 一了， 

, w r ■ ■ - 


j 

y ] aj ( A ,)=0 (j = l ， 2 ，.”， m ) ( 3 . 2 ) 

Ay~l f 

满足 （ 3 . 2 >的分値式 ：（ 3 . 1 ) 叫做标准分解式.此时〜 7 K 籽县一般 

• ■ ~w r — , r ▼ -w ，， w 蜃 ， *<• - ， ，■ _ / ▼ / *# p —^ ^ v ^ ^ f ^ 

平均戽， 心 ( A , ) 正好是因素巧在水平 A , 时的主效应 ft ( A , ). 以下 

口去 Ffei ^麻瓜42士 

八 >C* 、 'KJ 、 叫乂； /Iff* 八 . 

可加模型下的正交设计是这样的.设因素 K ，^ ，…，氏分 


E1 »1 / * 入 _l* Trt -r^ 上 £- Mr-^ Trt 1 - I . 1 V~I —1* •、*!* ' —nr- 

別仴 h T 爪于.心的仓眾 f 田丄，… ，\ 忙乙.选一止父 

丰.抱 F , . R F 体音访芊亡的 w 小加 卜 j 日棚虫必、领协 

-T^v 7 |*J - I 7 - 6 7 7 ▲ m |丄 <02*、 g |^ M V I X 4 —1— 7 /VU PA^ ▲ J 々、 

在水平数是\的列上，）=1，2,…， m . 将这些列保留，其他的列去 


+4 ?八 B : ZTil T / \/ \/ \ mr —r* -*^ 二 tr a / 、 \ ^r* H a A A* 士 il IJ\ 

坪， 1 守天 U J^n^Si /\ … 八 5 m 乂衣 /\=KAij ) , 丁定 /i ITJ 廿 1 了肌 1 V 衣 


夂县试 验备侔伽加 A 的笛 7 县试 賒各仳 （ 7 k 军铂会）县 .庙麦 R 

»—* ^ 嘁 、 ■ ■ ■ pr ^ 丰 办 P-» V ^1 ^ ^ ，濤 、 _ ■ 、 , j ， I -TUk 卜 H ， • V f — i 

取; U 水平， F 2 取 A , 2 水平，… ， F w 取； u 水平.换句话说， A 实现了 

t 


- hf 1 - J £ t -}4 - a ml reft ： u u ^ ttt m ^ ttt -tm -IS wi - 5 +f n w - fc 4 ^ 

㈣ 诞 kx. h fii m t>c h 什 • /yv 丄 xc m j jaj > ^vi hj 伏生不 rr, ts 文 q 人 

t * 


到了合适的正交表，进行正交设计是十分容易的 .把 各因素往表 


的各列上放，有相当大的任意性. 

瑚#来研奋.亦可加糂 ■ 的低宙 T . 加佰枏抿 TF 夺份卄很？ II 的 

试验数 据进行 分析.设各号试验条件下均进行了 r 次试验 

L 


①比可加模型更复杂的是带简单交互作用的 模型： 

m 

a(A*i ，•_• ，又加） tzo 1 > : o.j CAy*) I ^^^ tj CA 1 9 A ^ ) 

7=1 i^J 

本讲义不讨论这种模型下的正交设计.所谓“不考虑交互作用时的正交设计”就是指当 
作可加槙型时进荇的正交设计. 


« 
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k 笛；县试胳怎杜的激枢县 v ., ry=i 

\ • ， 7 ，|V — V 9 ^\ || I l-i V ^/V 4 /VA — K ^ ^ ▲ 


yTlfl 


厶 =1 


_* m v * k _ _ ■» __& -. 

于是有数学模型 



yik =/3 o + XI ft ( A t >) + e 法 ( i = l ， …，”， （ = 1， …， r ) (3. 3) 

j=i 

其中 a = a ,) 是设计阵， ~ 是试验误差，我们假定 { ^ } 是相互独立 

■ M • _ - ■»■ % ^ V. ▲ 鲁 秦 ■ k m. mi - ^ K ^ ^ 

的，期望是0,万差相等.有时进一步假 足以〜 iV (0， 〆 ）. 汪葸 
(3. 3) 中的未知参数满足约束 条件： 


y]Pj(kj)=0 (j = l ， 2, … ， m) 


(ri a \ 



我们的第一顶仵备县枏抿试賒教抿估计去铀叁教 （ A , A ( A 彳} 

p v ^4 才' ■ ▼ ， ， _ ■ y ，『 , w ^ p —■ *■ , p—i ,, ,_▼/■•， v v ， J 、 ■ ， J , / 


的值，从而可估计出 a ( Ai ，…， 的值. 


(?, ^ 乃 县播右的 击怎你 的线杜爐刑.筇们可 w 剎田笛 aa 音由 

\ v • w ^ X V >SL^ ■ ■' 14 V，|、 I I H V I—L- 7 II g -J ，/， ' I g / U ~v —|— I 

的一般理论.令 


yi = y ^ 





yi 1 fftd ) 


Y= 


9 





， j = l ，2 ，… ，m 





(5 个 1) 
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这里 




■x r / -t r -w r 乂 

A = (, iS „, A ! 

于是有 

Y=X./?+e 

这里 X 被设计阵 A 唯一确定，叫做 A 的从属矩阵，记作 X ( A ). 由 
于/?受到约赛，我们设法引进新的参数，它们是无约 束的. 

设 r , 是~阶正交矩阵且有 结构： 



令切 = T > ft ，7 。， • 于是 丁冲 = T i T , iPi = 、 W - j - E s } 

、 V inri ^.1 I 匿 塵 -^ __ jv 展 ^ ✓ irrt ✓八 j 、、 ■ ■-* ca 

这里利用 J 天承式见卞是 



XpUi ，…， x m ) 



=(E n jXiTi 



以下记 
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# 



X =( E n , X l T ^-, X m T 


參 



平县右 

w 1 4 


Y = Xtj H- e 


这个模型里参数 77 是自由的. 


* 


引理 3. 1尺(文）=尺（；0(这里尺 (A) 是 A 的秩）. 
证 明：令 



A 


[o r m \ 

则 r 是满秩方阵.于是尺 （x)=i^(xr). 由于狀=(£；，不乃， 


T ， n \ T-r^ -\r t-i 

A m i M , inj a ; i , 


之7^)=叉有相同的秩. 



T7 V \ -=-r m l— / it 

Ln ， 八 ji j I. Wj _Vl!i A1 , Ai ii , 


证毕. 


菁 


引理 3.2 设 A=a, ) 是X… XU 型正交表，则 

X / t X j = ^- E s E / s 


X / j X j = ^ I s (1 5 是$阶单位阵) 

证明： 从定义直接推知. 

# 引理 3.3 设 A 是正交设计，则X的秩等于 

1 -k V r ? . — n 

▲ I / J X ^ J ▲ X 

1 

证明： 因为 X,E,=E W ，从引理 3. 2 知 

E^XjTj^-E^.Tj^O 


參 
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a j w ^^ 




另一方面 


于是有 


可见 


rr^f 'xr / 'y Tt / 

1 ^^, 1 } = - 1 } 1 } = 5 


n t 


J, — 1 


x，x 


r 


n 


5 l 1 


1,-1 


0 


n 


Vi 




o 


n 

9 m* 




s 


^ s — 1 
m 


m 


m 


R ( X )= R ( X ; X ) = 1 ^ T!(5, -1) 

/ * 


证毕. 


* 系 3.1 设 A 是 L w ( 5 l x … x 〜） 型正交表，则有重要不等式 


2 J (^；-1 X ^-1 


J57T O 口 I t 73 r Tta O O 士 +* -Uh til 

un 1 ^ :从弓 I 牲。•。且坎低由 • 

* 

n 的最小二乘估计县 

■ a w • ▼ k ▼ ▼ r w ^ f w —， • _ ， 


7 =(x / x)~ 1 x / y 


于是 /? 的最小二乘估计是 


r 








T 


于是 ft = T ^()> l )， 咸=^)，不难看出 


蠢 


296 






_ _ - ■ 

7H J 


參 



r 


、 


VU , 

则 

—r- C3 

卞定 


k 


( X f X ) - 1 X 


n 


E 


n 


£l 

n 


j l 八 l 




s 


m 


T ， m X， m 






j 


丄 p 


^ = - E y=y = -2, y , 


n 


k 


^ i f, 'r A t r 

-^1 ；1 : A : I 


n 


H 1 


5- 


S i 


F F/ W’V 

— r $. 5 . ■▲ 表 • i 



jY-^Es (XjE^YY 

n n J J 


^ f ^%r / x r 


：3^ 




B ^ = Yj Yj (又 




9 »5 


i ： A ( j =A k = l 
n 


r 


Bjx = S 汐(又 o ， A ) 2 yik 


k 



/ 



N 



^ j {\) = —B jx — y (A = l，•••，〜) 




I 

(3. 5) 
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注意乃是巧的 A 水平下全部数据之和，二乃是该水平的 

〜 Sj 

出现次数，因而乃是 A 水平下的平均值.故公式 （3. 5) 的意 

nr 、 / 

义在直观上是相当明显的. 

真值，…， A w ) 的估计值是 



l^a^ii l- 1 -i 丄 ~^ 卜 | 瞥 、^ ti±^ • / r\\ i ■ J-. / a \ v rrt » I • ( n 、 

卯米佰怀俚越 X 越圩，取 A ) v/ A- w ^ 

* A 

曰 m AAi 曰 -L~r 」， TTt 口 l*h. 

疋四系 r ; 的取对小卞.亚热 




( 0 ) 


max- 


B 




可见，找最好的水平等价于找 平均值 最大的水平.当然 ur ，…， 

• 广。、、口 B 丄 — ^ 上 L —r- -rrt >tr / 丄 

A ； D 定琨 灯的丄 往汆忏 • 

亦 I -而的斗振由右一小番奧的胁占.去斗拆试验祖巷的士 /lv 

I— ^ ■ — 星 一 !-• ^ 1/ I | 1 ^ | 二 »-• V v 4\\\ •，■、 /v 1/1 w w • 

试验数据总含有误差，对因素 F , 而言，各水平下效应估计值(仏） 

66 若 © 士萌 tb 工证丁 EtffP 龙 M- ilC 且士商 rh 工彳曰老 fff? 龙 M-Q 

HV；^：rr 工又 pq 4 41 、丁， I 、 |hj/;/| y 工赘 JCU/t 工 3CPq 4 ) 工： 

* 

换句话说，应该检验下列 假设： 


T T 八 / 1 \ _ ^ \ r\ / O Z' \ 

rij : pj 、 l, = … =pj、Sj J=KJ KC>. OJ 

^ H： 祧桕錐 B 计 〔汶 B 计称 F . 县屁垄 : 的）.才能谥 R 的夂 7 k 平对指 

f — — J -# J— •-寸 、 w - -4 r^P ■ — j w ^* > ^ I^B ，广 — |*#W W — j 'V f~§ I ，■髻 ^ P—f 

标的影响有差异，哪个水平最好. 

T-J DB 9 i^r UU ^ 66 TrH Sit ^ Tfft ftb >f/K Tffl 

l^Lr^L u j VCi : /XL PU ^ I^J ACiS • Ad rp ^11 ^=H 

方法. 


(一）直观分析法 


试验工作者裉抿已柱的经验对术须试验中的误 差有太 致的估 


计，可以判断巧的各水平效应估计值 ft (1)，…，反 ( A ,) 的差异是否 
主要来自试验误差，根据经验来拒绝还是接受当被拒绝 
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时，挑选 F , 的最好的 水平； 当被接受时，原则上可随便挑选巧 

AAt 丄 T1/ / 、 tV rt-U 44=1 40 -r* />S-* AA -fch /lU >=^ ITf? 士 -klU 、 、 tV XM Y 工 IrJL 

trj / NT 、 当於込口 、 J M ： TR 俯大 W 、 丄 TPtrj 共 TQi 而女不匁 tOZE 八込 IT 冗过 

验挑选出的水平组合（例如 ar ，…， a ^)) 究竟是不是最好的“工 

-rn Art- I±l^ nn A ■、>'■ -«■-* 、 «i- / 一 t* 八 、— r* 、 __i\, t* 八一 • I. rrr - * 、土 ■ t » I * v i / Art A. ✓ fr\t 丄 m ✓•广 

荏泶 i 干"丫通‘吊安近仃叛 ut 试 叛：对 m 远^7八于组 甘卩例 卯 wr ， 
… j (()) ))抓奈彳井托一汝戒玄价莆有试验.丢砉汶时的推标倌县否 

^ w ^m ，， II ^ w V ^ v -5 ^n v —r*. '^zzu 7 i=i ^ 1=1 -4 v ^ i-t k 铩， y-sw 1 —# 

达到了优良的水平（注意，不是验证“最好”，而是验证是否达到了 
实际工作所要求的“优良”). 

(二）方差分析法 

这是一种比较精确的数学方法，我们在全面试验的数据分析 
中已介绍过.使用此法的困难 在于： 如何对试验误差给出客观的 
较精确的估计.我们指出，要得到试验误差的客观估计，最好是进 
行重复试验，即各号试验条件下至少要做两次试验. 


怎样进行方差分析呢？设在第〖号试验条件 A 


# # # 


， A ^ 下的 


试验数据为 3 M ， …， 3 V . 在数学模型 （3. 3) 中，我们假定 Ud 独立 
同分布且 eik 〜 N ( Q ， ff 2 )( cj 2 未知） • 


沿用前面的记号〜 ，瓦 ，成 ( a ,) 及 ta ) 等.令 




V 

nr 


了 = S ; 


y 


r 


yi 


2 


yu, 


(3.7) 




yi 


* w * 

— ^0 — 含 j (久" ） (残差）， 〗 = 1 


A / A 

S € =£ £ 

^r\ 

- 1 

y = — 

J nr 


( 


(£"••• ， e„)) 


6 仝 部齡抿 的军 也倌） 

' — l*«. « 'V 1 , w / 


我们首生证昍下别栢笺才 

M -4 V~ I ^ W . X ^ I ， W I- ~^ >4 


n 


^(yi — y) 2 = — 

i r 

实际上，于是有 

Y f Y=^X f X^-\-ei 


公 S F , + s e 


(3.8) 





S \ 


Vi 




n 




s 




m 


rj~\~ S € 




n(rjo) 2 + 1 ili + 

.^ s ： 


但 i = y ，故 


n 


m 


2 ( ^~ ^) 2 = 2 ~ + 

^ ， s; 


我们指出 


n >/ 

77 ㈣ 


s 


F 


窀际卜. 

〆 、 _ ，， 瞧-如-* f 


H = l ii 丁 ’ Y’vWi 丁 ’ y ’ v 、 

fjjfjj - — - -_ -- - 


n 


n 


s 


2 


y'x.T.T-x^y 


n 


c 


2 


/ 


^ TX 3 ( l Si -^ E s K Si ) X)Y 

n \ J J J I 

S • r ■» r/ y -w r f ~x T 1 ✓ -w r / -w 严 、 C 

三 I y AjAji — 




Sj 


s ‘ 


n u ^ 

9 ^ # 



， B n 、 

• 

參 

/ 

^ B n ^ 

• 

參 


• 

Bj s 

< j j ) 


•• 

Bj s ， 

^ j 3 ) 


5 


S j 


( S ^ a ) 


2 


s 


S' 


.2 




A=1 




故 （3. 9) 成立，从而 （3. 8) 成立. 


(3.9) 
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由于诸 + 相互独立且与独立，所以 S F] 


， Sp ， s e 相互 


'✓丄 ^ - 

3出 兄. 


利用关系式 



>: (% — 歹) 


k 


从 (3. 8) 得下列方差分解式 


V ^ V . —^7^=0^ VSo 丰 

/ J 、 7 K • J ， 、， / j -^r j ' * ^ 


€ 


ID ) 


其中 

^ ▼ ■ 


Q= XI (> — 乂 .) 


r 


S 


ytk 


是误差平方和. 


# 

山 : - \ 、 

m^r y i 2j 


/ 、…、 2 / ^ xn • • 、 4*0 ~xr XA> 士 T* rtfr -feftf /rrt 八 

^yjk ~ yjf y 一 w i^j w 


k 


S , 


# _ • 


Jjn -r— v 丄 i- a i*K 

Of ，： 5 e > r 日丑烛兑.並热 


Q 


n 


r 


yi — TI (：^ — M ) 2 〜％ ( nO —1)) (当 r >2) 


由干 

，P 


N 


(rj n - ~L x 
\ f n r J ~ l 


故 


Siff 


(仏 一 ^Vi — a ) 〜 f (〜 — l ) 

m - w - w - 9 - 


在假份 H ,( lp t (3. 6)) 下 

w _ _ ■ ' w .^ r — / 、 ^ ， 一 ， r , ， P 


nr 

r 

Sja " 


m m w m a 

2 9 /J 9 !J 


从而 


X (sj - 1) 


令 


pO *> 


C：_ / ( ^ _ 1 、 
U t、/ \ O j -*- > 

Q/ n{r — 1) 


m 
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在忱下〜 F (~ — 1,720—1))，故可用统计量来检验假 

T T 

议 rij . 

在上面介绍的方差分析法中要求各号试验条件下均进行过 

_# ■• \ >% —* A ✓ —M • %t># '•»»w v 獻 ■ ___ • 国 ， ■ . _ ■■— # #* M • 、 i^i. . — m A M —* I 讀 v f^ w JL J _ # *ft ■ ， - ■ • 

里夏试救（里夏数 r 多 Z ). 卯朱小作重夏试盤，母亏试遯氽忏卜 M 

右—木路新麻 r 办划田••• _、，志乍详时個 

n I y*^\ n 4/m \ j4 m j u j 丄， y jn -w /4^ / ^ it - ^ 4 \ ^ ^ / all i j 

检验？这是实际工作者常遇到的问题.这时对试验误差难以作 

山说 in 从 ) 丄 i=rr m nr 7? ir ^ ^ ^ ^ it ^ fth - h - ^ zv M >h d 

山 w w 口 y I 口 h ，皿币 h j rn 「 7 _j yu 里叉叫迦口 y w 左力 i?i ys jzi i j 

分析. 

■ A . / n 、 » I » 八 -i AFt 

HiK 6. QJ T G r = 丄个^ 


S £ = y ] (yi — y ) 2 — y ] S Fj (3. 21) 

i 7 = 1 

这里 S . 是残差平方和.裉据线性樽型的一般理论，当 f=n- 

▼ ^ ^ ^ 'm —，■■■_ »■ __ , ， ▼ ■飞飞 9 ^ ^ -^w w ■ . r ^ w 9^- *- - - w ^ 

m 

( 1 I V、/ - 1 \ \ A D-+ 

2u _ 丄 / j^ h m i 


S £ 



2 …、 

〜 z (/) 


于是在^/,(见（3.6))下 

S, /(s, - 1) 

F=J _ _ _ 

SJf 


(3.12) 


服从 F(s ： -l.f). 

，，，、 ，〆 ，—— 、一 j — ' j ，- 

故可用统计量 (3. 12) 检验假设 、 

如果检验的结果是拒绝则表明因素是显著的（即它的 
不同水平中至少有两个对指标的影响有差异）.如果检验的结果 
不能拒绝，而自由度/又相当大，则表明因素巧的不同水平对 
指标的影响无差异.当自由度/比较小又不能拒绝时，只表 
明：从 试验数据来看未发现 A 的不同水平对指标有不同影响. 

L M UX … X 〜） 型正交设计情形下（无重复试验）的方差分析 
表 如下： 


• ^02 • 



方差来源 

平方和 

i 由度 

F 值 

显著性 

1 

因素兄 

Sf i 

si—i 

Sf x / (^1 — 1) 

sjf 

S F /(5 2 — 1) 


- f 2 

Sf 2 

• 

• 

• 

So — 1 

_ V — 

• 

馨 

• 

* 

M 2 

SJf 

m 

• 

• 

S F /(s m — l) 


F m 

Sf 

m 

c — I 

m 

^ / f 

/ J 


误差 

s t 

m 

f=n-l— isj—1) 

l 



总和 

St 



i 


表中因素 F , 的水平数是~(1‘气，"_,;«),55的计算公式见（3.7)， 
S , 的计算公式见 (3. 11). ’ 

Sr - tiy .- yy ^ yl - 

1 1 

例 3. 2烟灰砖试验的方差分析. 

,»t 1 • _ 

继续例 3. 1的讨论.根据已往的实践经验，可以认为所考_ 
的三个因素对折断力的影响适合可加模根据前面给出的试‘ 
方案及试验数据，得方差分析表如下： 


方差来源 

平方和 

t 自由度 

F 值 

显著性 

A 

43. 89 

— r _ f 
* 

2 

A 9 46 


r \ 

r \ a /% 

6 % 4b 

m 

八 

L 

八 r \ i — 

U. JD 

\ 


C 

14. 96 

2 

1.52 


误差 ’ 

9. 85 

2 



总和 

72.13 : 

.8 

I 



本卩公东志 4 n 攸臾信 „(? n . 妨女魚蕃杜 ★ 笨/>^= 

▲ W • I， -W 'IP-1 V | I M. i U. yD v ^ ^ J- ^ |_L* »iy- |_L*、■ ■ 认 

0.05 时三个因素都不是显著的.由于误_的自由度太小，这只表 
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明从本试验的 9 个数据来看未发现因素的不同水平对折断力有不 

f=f SZ ni^t 

I 卩 J 影. • 

但是，根据以往类似的试验工作的经验，同一条件下试验两 

f 

、 • 置 - J-f - * Kl>r^* f 1 l ^ 丄 ~^ A" t 1,1 »""* -t*m >_L -« r*rt | ■置售 _ # _ —#lrt / V L.r** _ I _ • —* I. 蠱 A 

仄，饥断刀佰怀一舣 和差 小姐迓 1. 木用且观贯机法，且按对二个 
田麦的不 Ill 永萆下的指烷军也倌讲荇卜 k 紡.可!；〗 iJl 乇二个闽麦规 

F^-4 /g 、 P-i V I 冒 ■ WJ 、 I I i-f V ^ W KJ v I ， I ^ 7 嘁，，零 y 、 / v * I F~H Mr 

对折断力有影响，最好的工艺条件就是以前说过 的：成 型水分 

11。/ XK CC fhf Tnl 1 A /4V ― ^ 财舌 A f)f) Urr 

丄丄 / u ， |«j i\J J4 ， w / l i T.^ tw xvg, 

例 3.3 某化工厂生产一种试剂，长期以来收率一直不高，只 

士 儿7柏古 il " 由也2仆4二 *M 儿 丫7；聖1 口人 m 丰 

uo / o 江 > n . yy j i » E 问* ix 千，芯 近 1 j —兰 叫迦， fc/vyv r 7 uju i i^i 

可能对收率影响较 大：反 应温度、反应时间、硫酸浓度、硫酸产地、 

操作方式，每个因素想比较两个不同的条件(水平），具 体是: 

* • ▼ 

A/K=Tr^r 柏由、 A / c n ^n\ A rnr\ °n \ 
nvzx^mnu 又 y: \o\j j 9^2 v / w ； 

% % 

Rr . r , n / I 、时 na /1、时、 

丄 ， \ 4^. / I-* g 1 —vj / i ^ 1 \ ^ \ ^ 

C (硫酸浓 度）： C 1 (17%), C 2 (27%) 


IX 硫酸产 地 ）： A (天津）， D 2 ( 上海） 

£：( 操作方 式）： &(搅拌）， E 2 ( 不搅拌） 

这是五因素、每因素二水平的试验，可用正交表 L 8 (2 7 ) 来安排.例 

• «, 

如将泌，仏(：，1^£：依次放在该表的第 I ， 2 , 3 , 4 , 7 各列的上方，即 
得试验计划.现将试验计划和按计划进行试验得到的数据以及分 
析计算过程写在同一张表（表 3. 2) 上. 

• * t 

表 3. 2的意义 如下: 试验号1至8表示8次试验的具体内容, 

fr\t 丄 m At^ a m 、一 U ■£ ? 人 r-#_L JLt^ Z 一 口 -i r\ r% r\ -t art nrt A Tit -# A J ▲ ttT 

WJi ( U 乐 4 亏瓜诞刈 MtfJ 仃定丄、乙、乙、乙、丄，即囚系 / i 取 /ii 7 Nt ， i 3 

-1 

取艮水平，0取0 2 水平， D 取0 2 水平，£取£:水平 . I 表示各 

# 

▲ _ ■ _ - . 1 % i 身 * * ^ t 丨 a • ^ %, ■ ■■■ ■ | > - i —n ^ h V ^ ^ _ k . # » # - 螝 t 參# i 鼸巉 %. 砻 一 

夕 ij 中 1 对应的谷数据之和，11表不谷夕 y 中 z 对应的谷数 据之和 ，各 

因素所在列的;一沁早一^分别是该因素1水平与2水平的效 

»* , w <■ k. — — 


应.各因素所在列的下方的 S 是该因素的水平变动产生的数据的 


波动平方和.以因素 A 为例，从 (3. 7) 知 


夕 04 







r-» 

夕 ! J 亏 


74 

71 

73 

70 

73 

62 

67 



这里 i ^ il 分别表示第 1 列的 i 和 n . 

士了4 壮爲 卡兰乂■苗步山」圼兰亚卡知夕 U 8、初 

-4 mm I j yj ^jz, J4 v I ， mj j»fs <j 、 u~i >y^^cL i w f \« • " 、 v^* 广 " 

8 

■^― _ 飞 ， v O ， t V 

^> £ = 2^(^ -3^^ - 十心十 \ 十心十 ^ e ) 

1 

= 34 

— T 

方差分析表 如下： 
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方差来源 

平方和 

自由度 

F 值 

显著性 (a = 0.05) 

A 

m/s 

i 

7. i 


B 

81/8 

l 

4.8 


c 

361/8 

l 

21, 2 

关 

mm 

361/8 

l 

21.2 

* 

E 

v> 

81/8 

l 

4.8 


误差 

34/8 

2 




田妾 r n 且見基的 _册絡 齡始 ffiF 且 97吹 的 I -海本的 a ; 

¥-^ 习 、 yU A& >IK. HV y HA. ^fiu FP^ riA . ，人 /sC, u * ， U |_l J ^vj 7 . L . 1*-^ / H V l^-ua /、 

津产的好.其他因素的两个水平对收率的影响未显示出差异.考 

邊加丁料说描 Xt 七估 A:n 士加1+1 “且 * T ，，/4 -立欠 /4* r^rBh A D n 
卿: py 丄… j 从沐【卜力 IX ，沖干 I 7 U T 取 XT 土) 水|丁肌取 ni ， ui ，12， 

D 2 ， E 2 ，即反应温度 50° C , 反应时间1小时，硫酸浓度27%,硫酸 

、山 -UC^ t JLl* XO //-* —i-* >v « —r- LA/. _LiJ, /■ At* XPt-A*. JL/^ C=t 、 - 1* 入 B 丄今 / 丄 

述怦工拇广的，琛仆力 A 定个现仟（但侍辻思的定，込 T 琨壯來什 
并去亦8汝试验由做付 V 


这种用正交表直接进行分析计算的方法带有普遍性.用其他 
正交表时，计算方法类似，从略. 

*例3.4 拉丁方设计与数据分析. 

在农业、生物等领域常使用拉丁方设计,它与采用正交表的正 
交设计有实质的联系，我们可以认为它是一种特殊的正交设计. 

先从一简单情况谈起.设有4种小麦品种 A ， B ， C ， D 种在- • 

换古形田宙.萆 hk 銥产骨的高低_为了消除（成减小 ）+ 袖.纵向和 

/ 、 ， y ， 3 ^ • - • * • ' — 9 ^ « h # / » ^ -^r , ， ，■# I ，、，， «_嫜|，礞， 、 y ， ■ * ▲ ， ， # 7, i I I ， ■ 

横向肥瘠不匀的影响，以比较品种的优劣，将方田分为 16 等分，种 


法 如下: 


、\ ^列 

行' \ 

•- \ 

1 

2 

3 

4 

1 

A 

B 

C 

wmsm 

2 

ibiqihi 

A 

B 

c 

3 

c 

H3BI 

A 

B 

4 

B 

C 

D 

. A 
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每个品种在每行每列中各出现一次.比较各品种的平均产量就可 

A*rt At -HX* 上 “ /1\ 夕 Lx 

定义 3.2 A 个处理①1,2,…，々，安排在 kXk 方阵内，使每个 

# . I |1 >"■■'# # 1 M — * ^ ,纛 * 蠱— ft W # _ * _ 1 % i 丨 __ 氣丨 #»» _ . — t k V . 

处埋在母 仃母列 均出现一仄.这枰的一个安排叫做々 X 々拉 J 万 

¥ I • 

显然，在这种设计中，每个处理重复了 々次. • 我们说拉丁方设 

44* 命由 u 曰一 m 虫 a/itt 六丄 Bn 1 « / r 3 \ acii -： rt^_L 一人 m 虫曰 

y\ 大丄疋二四承 trj in tsc h ， pp 、允 j . 二」▼吻承疋： 

* 

①行（毎行看 成一个 区组） ，共有 A 个水平 ，用1，2，*“ J 表示. 

- ▼ - ■»■ • *■ ，广 ， w ~ _■■■■(* • ，▼霣 ~w ， ▼ ■ - r w ~w - - r ， ▼ ▼ 

/"^\ Tf*! —LL>. / * T .A. —I* TTt * t i f l - 騖 -1 t t • —* #. I ■ III J-i^ 1 * T 入 I » 

^ 列，兴咽&下爪于， m 用込 z ， …，々衣 tk •⑶处埋，兴句々 T 爪 
平_ 6 X 6 枋丁古份朴可田下万 II 「 ,2 n 3 ) 刑 TF 亦卖 f 志？ U 本空柳 

I • 一， ，一 ^-=** V >^V r I ^# / |^ I ， J — r R \ II* \ w v • 


生 1 1 

I 


行 

列 

处 理 

数据 

1 

1 

-1 

1 

Ai 

3^i 

1 

• 

• 

2 

m 

• 

又 2 

m 

參 

yt 

m 

■ 

• 

1 

馨 

k 

• 

Xu 

， 

• 

Vl 

2 

1 

Aa+i 

yk-\~ i 

r 

/ 

• 

• 

> 

1 

1 

2 一 

• 

參 

ill f t A 
乙 

響 

• 

Alt i A 

j^r-t £ 

m 

• 

• 

C 

• 

• 

_ 

> 

4 

1 

\ 

馨 

A 

• 

• 

• 

1... 

AZA 

m 

參 

• 

扈 •_ 

JZk 

馨 

鲁 

• 

k 

1 

> 

m 

馨 

1 

• 

A(jfe-m+i 

• 

yik-\)k+\ 

k 

• 

• 

2 

馨 

參 

Aa-m+2 

• 

馨 

y^k —i )^+2 

• 

• 

• 

k 

• 

k 

• 

Xk 2 

• 

yk 1 


这种正交表 ~^ 定有 • 实际上可取 


#■ 


» 


①“处理”两字作广义的理解，见第三章§ 6. 


f 



^ Ai. = l t A 2 =2, ••• ， X k ~k 


、 —— L 1 

八奸 1 — K ， 八奸 2 


， —— L 

八 2 是 — K 


^2H~l = 是 —— 1 ， A 


Ik^rl 




是， A2H-3 ~ 1 


^zk = 是—— 2 


A 


( 卜 1) 奸 1 


， _ r\ 


m m m 


h 2 


■ _ 嘩 


-■ 

丄 


统 i +4 V 拓 : ^：^ tTF 亦份计楂开4下的齡拒公折田妾沄矣 

▽ U ， | 1/ | ^ V 1 * » r I I "V 命 H /V 1/ I - / l'# JA '〆、■ ' 4— * — 

中第 j 列水平 A 对应的数据之和，例如 Bn^yi +’九+…•用了 


, h u 

, r ^. 

表示全部数据之和，即 T =^ y t . 要比较不同处理的效果，则应比 

# • 

1 

Z_ 4^-r /^' 

双 k I 丁 ^nna: 


B 


si 


k 



为了检验各因素（行、列、处遒）是否有影响，有下列方差分 


析表: 


方差来源 

平方和 

自由度 

显著性 

行 

k . r \ 

0 _ 1 V i " 

5行—々七月 u 々 2 

k 一 1 


列 

S 列一灸 2 ^ 2A 々2 

A = 1 

k — 1 


处理 

S 处理 ~^J B 3 X — U " 

K A =1 K 

k 一 1 


误差 

S *= y ^ jy t — ^? — S n — S 列— S 处理 

1 

(々一 1)(々 _ 2) 



# m ^ ^ 染瞄坊丁卞份朴 

k 4 v ■ v ^ P A4H 钂 /V ^ I • 

I 

除了行、列、品种三个因素 外再加 一个因素——施肥方式，怎 

找忠 : 能士访 UStil 轴广 T^USHafcBP 士 : 的 >H? ■ 少 9 某々仙 
1 丁 Jir WCi ， |HJ MM TV |-4 ARE*/J Li yJ / MV l/U^7 : ^ ^ UJ 

安排是所谓希腊拉丁方设计.设各个因素都是四个水平. 四个品 

种: 炎，五，(：，1) ; 四种施肥方式 : 《,/?， 7 ，心可如下安排.. 
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含 义是： 在每一小块田（共 16 块）上拉丁字母表示种植的小麦品 
种，希腊字母表施肥方式.全部拉丁字母构成 4 X 4 拉丁方设 
计，全部希腊字母也构成 4 X 4 拉丁方设计，而且这两个拉丁方设 


J 丄 -^ -4A -2^ / A \ / r> / T^v cv\ III T-m viU L 、 UrL_i 丄 nit 

H 付坏大尔: , 、 D，pj ，••• , ku,0)^Ua^X 一 <A. 工比叹 H 


做希腊拉丁方设计 


Art -nr/ 、 n i—t y t ■ l ■秦 v A ✓ I . T _TTf 、癦 ▲ a ¥ t m rtm > ^ tv ‘ t ▲ 

n 个 （7 jc 干）： Ai ， a 2 ，…， a ,， 施肥万瓦也 


右各 小.~ 胼谐番腊枋丁古县搭 b ^ Cb 古协.毎+古协 

■ -4 ，分 I • 1 y 7 7 U.C • f ^\ rnj "P |j A#IH -4 y^V 4 |=| • v ' ' ，， 7 I XV Y 、 

• W • * * -* 

上放上一个 A t 、一个 使得每行中每 个 A t 恰出现一次，每个~ 

tU m 益方 iij+t 旦士口 iTF? 口 ，羞 〜、 女 P 水 七吐出^^山咖一 
I 口 UL| W ^ ^ 7*4 9 HU J=L V^Lj 9 U } J ^5L \ 刀 「p | 口 UL| 少义 U 

r 

次.这实质上是 JUKP ) 型® 计.可以证明々专6时这种设计均存 


在(々=10时是1959年才发现的），但 k = 6 时不存在，这是1901年 


用穷举法得到的结论 



希腊拉丁方设计是一种正交设计，可用正交表来进行数据 


/钂 W I • 


v 更一般的是所谓正交拉丁方设计，它实质上是 ( P ) 型正 

v . w 〆 一 S . 

交设计.可以证明，当是是素数或素数 幂时； 存在以(^ +1 ) 型正 
交表.有兴趣的读者可去参看 [5] 和 £7]. 

附:考 虑因素间交互作用的正交设计简介 
_ 我们将以 L 8 (2 7 ) 为例说明有关的概念和方法.先引进一般性定义. 

定义 3.3 设 A = U y )„ Xni SL„U X … X 〜） 型正交表，1<夂<饥，1< 
) 2 <饥，1<々<饥且 h , i 2 ,々 两两不等，称第々列是第夂列和第 j 2 列的一个 
交互，歹『，若对一切 u ^ u ( l < u < n , l < u < n ) , 只要（又,.,. ， A ,_,_ ) = ( A ,.,. , 

—• ， ▼ W » — ^ —■ • ， ， ， - 1 J ^ •丄 J - /上 

A , 2 y 2 )就一 1 定成立 ' a = ^^ t 2 k - 



对于前面介绍的 L 8 (2 7 )( 标准表），不难看出第3列是第1列和第2列的 
唯一'交互列，第5列是第1列和第4列的唯一■交互列，….对于这个 b (2 7 ) ， 
任何两列都恰有一个交互列，见下表. 

M 2 7 ) 标准表的交互列表 



注意，由于第列和第列的交互列也 是第必 列与第 i 列的交互列， 
而且任何两列的交互列只有一个，故在上面的表中只对 h < h 时给出第）, 

_ • 禮 A A _ * » Jk inn. ■義 — ■■ 隹 •_ — hi • — 身 » Jb 禮 ^ _» flh A Ma kk. - Mm M . jf. ^ 

列和弟 ） 2 列的交互列是第几列.例如第2列和第4列的交互列是弟6列. 
(注意，对于 L 9 (3 4 ) 来说，任何南列的交互列是其余两列，对于 L 27 (3 13 ) 和 

^ — \ ^ • 磨 - 邊 ^ - 廬 • 詹■- # • 1> - mi . . * 蠢 - — _ ^"1 ■ — 身 ■ 獻 k — 詹 «. 蠢 - lh i — ■■晶 • j ^ 1 ■«■ * • 一_ 

L 16 ( t ) 则有较夏朵的又互列表！ JALL ^ OJ . 还有正又表小贫有又互列，例卯 
L 12 (2 n ) # ) 


—^ T-g—* W «« -!«#■ ^ i-* H 晒 i__ ■ 蠱 »-r-r — • •一 J ~^ v it- /一 — —1晒. \ rt \ • 

卜 囬罕例 1 兄明考思呆些父且作用时卯 1 卩 j 近仃止父议 rr . 


例 3.6 考察拖拉机在不同作业速度下某些部件对驾驶员耳旁噪声的 
影响.拟定的因素及其水平如下表所示，并要考虑交互作用 AXB 和 A xr 
的影响.试验指标是耳旁噪声，指标值越小越好. [2 ° ] 


因素水平表 



t 


A 

B 

C 

D 

(速度） 

(_ 驶室） 

(轮胎） 

(风扇) 

IE 挡 

开式 

通用加宽 

改进型 

n 挡 

闭式 

越 野 

普通型 

















正交设计的步 骤是： 

(1) 选取合适的正交表.本例中每个因素两个水平，4个因素加上要考 
虑的两个“交互作用”共六个“因素”(每个“交互作用”看成一个“因素”).选用 

TF 夺卖丫 M 县会话的.宜 别齡 轺讨 fi 

* * ▲ v — o'— ， / n-« ， r~r "v 1 ^ v • 


(2) 将字母 A , B ， C , D 适当地放在 L 8 (2 7 ) 的某 4 个列的上头（这叫做表 
头设计），原则是:避免单个因素与要考虑的“交互作用”混杂，其具体含 义是: 
使得每个因素所在的列不能是要考虑其交互作用的两个因素所在列的交互 
列.例如，若将 A 放在 L 8 (2 7 ) 标准表的第1列上, JB 放在第2列上，由于要考 
虑交互作用 AXB ， 贝 ! I C ， D 都不能放在第3列上（因为第3列是第1列和第2 


列的交互列），若将 C 放在第4列上，则第5列上不能放 D (因为第5列是第1 
列与第4列的交互列，而交互作用 AXC 又是我们要考虑的 ），£> 可以放在第 
7列上（也可以放在第6列上）.这样在丄 8 (2 7 )(标准表）的某些列上安排了 

因素，有匙列体现了“夺百作用”，此外县空列（去安排因素也不体现要考虑的 

, , 丨， ^ ▼ _ ■ ， -W p f r * ^ r ^ F ， ~W w ▼■零 r w 9 W 广 ， 'W ， - — 

“交互作用”).刚才的安排形成“表头设 计”： 


因素 

A 

B AXB C AXC D 

-■ r^t r — 1 

夕 U 亏 

<■* ^ mm 

丄 Z 6 4 b b / 


( 3 . 13 ) 


7H? AUt S U M )rL 99 —T* 1=1 vtA- 上 A Ofcf A n ^ _/V Qtl -A- Afif 1 TT»I Xe£C 

女 tt 思 tTJ 定,衣大议 TT 个 定阳一 忖刀 •力|』取仕 币丄 yij 、5 P 

4 列、第 2 列、第7列上也可以，此时第5列体现交互作用 AXB , 第6列体现 
交互作用 BXC . 

(3) 写出试验方案 

亦 t . o (? 7 ^ 卜祐眧 卜冰丰 I 份 i+n * m 抱田眘 A . R . r . n 研亦的利（刖笛 

卜上-、一 ， -JL • m 丄一 * * 7 —" 7 一 7 ^ ' 卜 *^ " v ， w 、， ▼ 濯 ， i ， 

1、2、4、7 列）取出来，把各列中的数字换成对应因素的水平， 1 对应水平1，2 
对应水平2,这就构成了试验方案.内容如下. 


拖拉机噪声试验方案表 


田表 

试验^ \ 

(1 )A 

速度 

(2 )B 

驾驶室 

(4 )C 

轮胎 

(7 )D 

风扇 

1 

a)ni 挡 

n 、并才 

' 丄， 〆 ■ 

m 雜诵加密 

' ▲ / |=| /-#>-# 

m 汝也刑 

' * , ~j~* 

2 

⑴ in 挡 

a ) 开式 

(2) 越野 

(2) 普通型 

3 

a ) 瓜挡 

(2) 闭式 

(1) 普通加宽 

(3) 普通型 

4 w 
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续表 


V 

试验 

* 

(1)A 

速度 

k 

(2)B 

驾驶室 

⑷ C 

轮胎 

(7)D 

风扇 

4 

(i)in 挡 

(2) 闭式 

(2) 越野 

(1) 改进型 

5 

ZO \ TT -hk 

W 11 才二 1 

# 

/ 1 \ 立士 
、丄 y7T ： p^ 

/ 1 、 2S 4»rt 电 

v w « a/iu j ? e * 

(2) 普通型 

6 

i 

( 2 ) n 挡 

(1) 开式 

• 

(2) 越野 

(1) 改进型 

7 

(2) TI 挡 

' ， - w 

(2) 闭式 

(1)鲁通加宽 

■ • ▼ ， ▼ 丨 - 

(1) 改讲型 

- 聲 ■■ — 

8 

(2)11 挡 

(2) 闭式 • 

(2) 越野 

(2) 普通型 


以上就是用正交表设计试验方案，即进行正交设计.下面仍以上述拖拉 
机噪声试验为例，粗略介绍正交设计下的数据分析方法.已知按上述试验方 
案进行试验获得了试验数据力，: y 2 ，”•.,％，这里: V . 是第 i 号试验下驾驶员的 

苴态睡宙倌仿县 . 刖齡堆卜铟古浓 IB 下志 

/ ~ i-^ /、 t p^r 从 -^ 八 * / 一 /w v -^w • 


试验结果分析表 

















表中各列的 i 表示“1”对应的数据之和，各列的 n 表示“ 2 ”对应的数据 
之和.例如，第1列盼1=%+%+%+% =381，第1列的 n =： y 5 + A+w + 

% =364;对于放上因索的各列来说，各列的 j I 表示该列上的因素的水平1 
下数据的平均值，各列的 j n 表示该列上因素的水平 2 下的数据的平均值， 

J 

极差 i ?= - j 1 _ T n 则表示该列上的因素的两个不同水平对指标 （噪声 
值)带来的差异.显然极差越大，则木同水平带来的差异越大.对于体现“交 

i * I 

-IT— r T1 •• _/ # . \ 麵 ％ * » 1. to —, 二 1 - , •* ■ ‘ 丄 - 、、 • / 1 - __ e_ t 上 1> 

丑忭用 " 的爸 夕 !) 米況， 0 』以仳明爸夕 Ij 对 M 的极差 K 止萣剡跚玖刊所评现的 

“交互作用”的大小，尺-大表明“交互作用”越大，尺太小则表明该“交互作 

CXI 99~=Tt l\ I hwt mir / tlfit* 、止 、 - r" rtD I I \ XL . -1*^ Ott. Jtrt I f t - TTtl .1 、 CCt ■p** / “ -A* 

用 hi 以忍、吩 • 子 ut 明久财八尼、乙，仪阳饭左认人到糸、迅估乂 

互作用”)排上次序，以显示其重要程度.在本项试验中，各因素犮“交互作 

用”按极差从大到小的次序是 

* : B 

A A \. ^ 瀘、 ✓ 

A, U, AX ii, , AAU 

D • 

AXC 所在列的“极差”相当小，可以忽略 、 C 的两个水平中 G 比 C 2 好， D 的 


两个水平中 M 比 D 2 好(因为相应的+1比 + n 小而 AXB 所在的第3 

t 

列对应的“极差”超过因素 B 所在列对应的“极差”，因而要重视 AXB , 即要 

p 

研究因棄 A 与 B 的 7 k 平搭配对栺标的影 为嵌赛 研究二元表： 

— ^ ，— * 严■▼- ▼ w ^ ~w ^ -w ■ ▼ 擎■冒 r —~ 軍 w 'v 『， ▼ ， w ^ ^ ， '' w ' ^ — ■- ▼雷 


b 2 


A , 

——X 


92 + 98 


95 


94 + 97 


95. 5 


A2 


O d 丄 Q Q Q A 丄 Q 1 

"^--93, 5 ""^- = 88, 5 


汝个卖田本妻呆田麦 A 知 R 的夂轴水眾撂 BP 下试验救抿的平尥倌 1 例加 A 

7 — »： , ，鏵 , I 、 ’ • ■ I ft—i f 广蜻 ， I 4 m ，■# 崎 ^ 碡、 I ^ i■' ■*> * v ■一一 

取水平 US 取水平 lC ^ Ajr ) 下共有两号试验:第 1 号和第 2 号，试验数据 

‘I 

■^ 砻 %, ' t •一 麄 ▲ * • • 1 ~| 0 1 _ ▲ 一 矗 蟾 _ I 釀 ‘ -if ^ ' ■ • 風 t ， 

W 予网值为 = __ — -- - = 95 ，A 取； JC 干 l、b 取; 5 Cf 以即 A ! 块） Ma>B 


■ 

两:号试 验:第 3 号和第4 f ，试验数据的平均值为= 5,其 
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余均类似地算出. 

从这个二元表看出，搭配 a 2 b 2 最好（因为平均噪声最小). 

总之，四个因素的水平的优良组合是，这就找出7；优良的工 

I # 

耜备件.凍麽 ffl TT 挡、蜜#宝田闭式、鈴眙用魯诵加甯而 RL 扇用 Hfr 讲 ffll_ 此备 

»■■ ■_ ，，， ■膠 » ，，■^ ApB . 罅— • ，~^ x 1 v ■ ’碡 ^ 層 t M f 9^ ^ _• _ ■，嗜 厂 ，，，•«， i -^ 内 i >—■ *> ， r ，寸， 

件下驾驶员耳旁噪声最小. 

以上是用一个例子粗略说明考虑交互作用时的正交设计及数据分析方 
法（未介绍方差分析法），所用方法可以推广到较大的表(2 15 ) 和 L 32 (2 31 ) 
上去，虽然所遇到的情况比 L 8 (2 7 ) 时要复杂 得多； 也可推广至 L 27 (3 13 ) 及某 
些更复杂的表上去，但情况更为 复杂. （例如 L 27 (3 13 ) 中任何两列的交互列有 

a * 

» *■ 

两列）.要了解这些复杂情形下的正交设计，请看专著 [7] 和 [20]. 

» ^ * 

葙们楛屮.坏右你玄适法你田 TP 夺份 i+ 的古法.伽加拟田芊法 _ 拟 7k 苹 

II <J 豸 H 7 O W V ^ f I 二 ^ 〆 、■»*>， / 1 碲■ 墨 I _• ，扉 "V 7 ^ F—* 嘁 ， | 

〜 ' V 

法、并列法、直积法、部分追加法，等等.可参看 [20]. 

1 I 

*§4平衡不完全区组 ( BIB ) 设计 

这种设计在农业、林业中较多使用，从一个例子讲起. 

例 4. 1设有四种小麦 品种: 炭、5、(：、1)，又有四个区组，每个 

区组恰有三个单元.同一区组里土壤条件一样，不同区组可能有 

— • 

较大差异.问：如何安排品种种植以比较各品种产量的高低？ 
有一种试验安排是这 样的： 

T TT TTW TT T 

丄 11 111 IV 

B A C B 

\ 

M M rnrnmmm^ ^ W- — -~- A A 參 ft *>. i 

A B A D (1， U ， Ul ， iV 是四个区组代号） 

r n n r 

ju^ x^y 

(把区组内的品种写在该区组的代号下方）.这种安排有如下特 

七 yr ra _口 rtf-JT 你姑 T f?C ； 古、口右 tt 救出妇 fc*TT/*XT 由八 M *、 n ^±r 4dt 
AA : TH |MJ — RtSTVr/71 "R 口口 TT 节 P 乂 11 卜「 V /|、 兀土 | 工 / ，八乂 ] 卄二 . 

个木同的品种.每个品种出规次数一样多（都是三次），而 且每一 

Tt-i. tn ^u« tit Ttn r=i rrr An aa mJu / -yxt ^ —- viu 、 、-^ =co*)rL > r mi i±l 

a、j e&rrm 现仕 fj 一凶迅 trj 认戮—杆岁、邵定一仇八込 w 议 it 叫 i« 

平衡不完令区组设计，简称 BIB 设计. 

, 罗 ， ■ ■ _ mrn ^ , % 'W W "W T P 

BIB 设计的一般定 义是： 设有 t 个处躔 （如品种），6个区组， 

• ^id • 

A J. 




区组的大小是 jK 即各个区组一样大，每个区组只能含有 6 个处 

xm \ 1 ^ ^ 人 xrr Att m —r* i 人 AL -rta hht >CB i 人 rrr M m Af-» 

性八尺、卜石住迅生 ^p ： 5CflF 「 /2 "r^u ：o 

安排有如下性质 :每个 处理出现次数一样多（叫做处理的重复数）， 

. 

h=l t-»_L £.t -rtit ■ \ w -wrr t * lz=f i~ — am il \tAi ^ | \a j^. ^ h . i tt / 、u 山 / - 、 ir*_t 、 - 1* 

母一对处埋 m 观仕 N 一凶组的仄奴一怦多慨 TO 遇 数），则孙込 

榉的安排县 RTR 份 i +_ 

* , 「• f ^ II iw — —— ^ ，■罾 

在 BIB 设计中，用 r 表示处理的重复数，用 A 表示相遇数. 

兑權 4 1 女 RTR 沿 iM * 由.次:矣粉右 TC 刺龙玄. 

^ 9^ y I I y i_4 夕 .HA. rj I y '4 i 

' bk^tr 

, kf = r ~h A _ 1) . 

证明 ：第一 式是显然的，现证第二式.任固定一个处理 A , 及 
处理'(£^)),{炱,， A ,} 共在; I 个区组中出现.，含有 A , 的区组共 r 
个，这样的每个区组包含 A : 以外的处理有 k ~ l 个，因而这样的 r 个 

t 

区组总共有 r ( A —1) 个单元.另一方面， A ; 以外的处理共 £一1 个，每 
个出现 A 次,故 AU —1) 个填满 rQ — 1) 个单元，所以 rU _ l ) = 
AO —1). .证毕. 

由此可见，在 BIB 设计中只要 i ， 6, 々确 定了，则 r 与 A 就确 

J * » —， 

疋 J • 

在 BIB 设计中，通常写出四个参数 ( r ,6 M ， r ). 

例 4.2 BIB 设计(3,3,2,2). 


区组 

\ 

i 

n 

in 

A 

X . 

X 


B 

X 


X 

C 


X 

X 


/ >4s- vV 曰 xzr M t A-t /*L -rta a n rrr ao tt / »L tw 4 rrr Aa ttt A=-t 

v a 入疋 a 组丄 m a 处牲 /i^d ； 1A.5E u m a 处牲八， 1 ; mm a 

处理 B ， C ). 

例 4.3 BIB 设计 (4,6,2,3). 


t 

mMm -W" 










给定参数 £，6, 々，怎样进行 BIB 设计？现代已有大量研究.构 
造理论属于组合数学的范围，读者可从 [5] 或 [7] 中查到试验工作 

由 ffl 刮的份计_萆沣音的县 .# 不县对所有的 z . u.mR 份计都 

I ，■寸 ^ -，丨- t , / • i — ，— , — , -- , _ p ,， 

存在. ^ 

BIB 设计木是正交设计.我们甩1，2,… d 表示 《个处 理，用 
矩阵(化)^表示 BIB 设计，这里^ 

f fl , 当处理 i 在区组 j 中出现 
〜 = u 否则 

不难看出 




(处理的重复数) 


/ I 


r=l 


y ： 


现在来介绍 


(区组大小) 


( 相 4 禺新）劣 Hi 

、 ■ i-f ^ - 1 , \ J 


\ … 

lr , 当 


(4. 1) 


nm 


设计下的统计分析. 


令 D ={ ii ， j ): nij =l } ，当 ~ 6 D 时，用： y l 7 表示区组）里处 

nrm • rt~L AA 44^v -kn Ttm ^ci>r ttt / Zial 4*^ 曰 - \ ^li An r-^-t -r* irti -^rr 4«r» omr 

牲 i 人 j Mtrj ： rsT 小肌伙 !1 但、 1^304 厂里八 tPciui 扠疋书 r yu m j mmm 







( Ci . i )^ D ) 


其中&是处理效应， ft 是区组效应，适合约束 条件: 


b 


^ y y j ai = 0 f ft 


为了找出 fl ，( Xi ，氏 的最小二乘估计，总，我们采用拉格朗 
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曰乘子法，令 


， W 

Q = 2 (九. — fi — ai — (3 j ) 2 + 2 Ai ^ aj + 2 X 2 ^A 


(*, P 6 D 


解方程组 


dQ 

3 h - 

dQ 

dai 


= 0 (j = l ，2,…， 6) 


1 .2 


(A 


(4.4) 


t 


{ ZV =2> 


(4.5) 


从 (4.2) 知 


負 

2 ~ 冲 =o 


(r,»6D 


( N 等于 D 中元素个数，即数据 {： y , } 的个数），故 


f 1 _ jsj 

iy ( i ,»6 D 


(全部数据的平均值) 


从 (4. 3) 和 (4. 4) 知 


J^v 


u 

£ — 2 


» * f ^ # 

tjMj 


(A 


这里 


一 ▽ — 

•龕 廉 • ▲ ■ ^ ■ 

x •— jLj yij y*j~ z^j yij 

j 6 D 

/ A z? \ ^ 7mvT-+ -^-IV Xrt 4m 

八 

Ai =ry.. — r/u 

/ A n \ _4^ ^ ^ . 士 rCn 《曰 

v^t. i ] $^TH1 守 


mr 

v .. —— kfi —— kB ； —— > . n：：a i 

^ j i ~ 厂 / / J L J ^ ^ 

i = i 

y * j ~ z^j 


U . 7) 


(4.8) 


Xi = ky , 


(4.9) 


I t Z 1 A /> \ Tt / A r» \ A*rt 

^)£> LK ^. Qjyv 


a ^ I v ， ▲ ^_ 

kyi •— rkjjL — rkdi —— k n ijpj = kry 


▲ 

rkfi 


(4. 10) 


?77 




从 （4. 7) 及 （4. 9) 知 


w. 

2 —rkfi—k^ n^j — XI ( 2 Ul i ni i ) a 


i = 1 


_ L / _ /A 1 1 \ 

二 Rry “ — TRfi v 吁 • 丄丄 / 

从 （4. 10) 的两端分别减去 （4. 11) 式的两端，并注意 （4. 1) 得到 


^ t = u^ kyit ~ 2] 〜 


1，…〆） 


(4. 12) 


从 (4. 7) 和 （4. 9) 得 


ft 


Ck > 

(: y” _ riijUi )— y.. (y = l， …， 6) 


为了检验不同处理对于指标是否有不同影响，应检验下列 


fii I 、 n 

假议 


Ho ： 


塵、— V W 鼬 ■■■ _ ■■ • 

米用统计量 


Sat / {t 一 1) 

O / / IL L i /_ I 

O e / KOR — l — o ~r 


(4. 13) 


其中 


s - at 2 (- 


X ] ni iy -i 


Xt 


厶 


# m ■屬 ％ 

k 斗 . 丄 u 


S . == ^ 一 v .. ) 2 —— k ^ ( v .； — v .. ) 2 (4. 15) 

— ^ / j ' ‘ j ^ j ^ - j ^ ' 

u ， j)eD j=i 

- d 1 
y •广 T y .j 

可以证明（参看 [7]) ，在 fio 下， F 服从自由度为£ 一 1 > bk — t 
一 6+1的 F 分布.给定显著性水平 a ， 査 F 分布表得临界值 F (> . 
当 F > F 0 时拒绝 H 。， 即认为不同处理对指标的影响有差异. 
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例 4.4 某化工产品生产过程的反应时间依赖于所用催化剂 

A/t ^ 相 >3 ： '-I- TtA. I f/ a X^U 仲 i\^ ^n\ AA //- m 也 r^r znl 业 、1 A/t 必 

trjrr 天，布至旭 xita 题 rL 仪兮 rvmvLm trjTF/tj. 到职竹 trj 左 

异可能干扰催化剂的比较，决定将原料批取作区组因素.但因只 

a _ul nxr o?、i -nr 匕 _lm. nxr 山、1 i—t Mr o nu* /U 4 /n -Ait m. 、一 tt 八 丄 ‘ rt ak / 士 cm -z— 

书斗： THJ 示科， IIIJ 母 tfCUJS 1 、 科 K 败 3 w 椎礼： rrui 炚巩 驱， fix 只目 Blitl/tM 、 兀 

仝区组设计. 

在此试验中，要比较的处理数〖= 4,四种催化剂分别用1,2, 

3.4 丟示：叹组教 .6 = 4 .卯秕 M 挝分别用1 .2.3.4 妄示：冈组女小 

_ , — 、，•<# - 7 ， ■ ^麗 J - •— — / r * ， ^/，，， . , | / ^ ， V 4 , ■， — , / — / — 7 • ■ — ^ * jfc ■ 

^ = 3. 此时的一^种 BIB 设计为 (4 ，4，3，3). 



/ >^ \、/ 日 tzr 厶 tr 1 ^7-» AL -rm i o >* pm Me -Ui> 企、【 /V Oil m a^c ^ n a ^A* 

VS 入定 △ 组丄 m a 乂 [ 牲丄，乙，兮，即乐一： THJ 眾科 7T 力 , J/tl 米丄 1T 

催化剂进行试验，其金类推）. 

^ w w 『 ▼ ， ▼ ▼ ， w ■ I - ^ r -^mr ▼ ■ 

试验结果见下表(单位 :分） 


^- 

区组 

/•L -rm 

1 

2 

3 

4 

和 > 

1 

73 

74 


71 

218 

2 


75 

67 

72 

214 

3 

73 

75 

^ o»v 

68 


216 

4 

75 


72 

75 

222 

和儿） 

221 

224 

207 

218 

y. . =870 


_irt rm XA* 仲 /f> ^nl A/~» i-4r 八 a“ \i / a i o \ A*" 

汉四打准扣刑 trj 双观 77 力 ai ，幻，《 3，《4 14,701 


—f (3 乂 • - a = l ，2,3,4) 
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于是 

ai =y[ 3 ^i. — (: y.i -\~y .2 + ： y. 4 )]=— 音 

▲ 1 - 7 

a 2 =f L 3： y 2 : — (: y .2 +： y .3 +： y .4 )」 = —f 

> 1 「 _ 4 

a 3 = - g * L 3^3. — (: y.i y.2 +: y .:3)」 =_ . j 

* 

- _20 
C4= y 

ttt m / 士 ttr Adc i au* ap /r> -^*ii trr "_l i^rr b act 、脅 - 4W ti 八 /m ^rL 

H J 儿仪用乐丄竹懼札刑 / 乂 M ： 口 、 J IN 取规 . 刀 J 恆涯 1 扠 汉： 


可采用统计量 (4. 13) .在 H 。 下统计量 F 服从自由度为3,5的 F 
分布. 从 (4. 14) 知心 =22. 75,从 (4.15) 知 S , = 3. 25. 于是 


22. 75/3 
3. 25/5 


= 11. 67 


若显著性水平 or = 0. 05,査 F 分布表知临界值 i 7 。=5. 41，于 
是应拒绝 H 。. 

丄, ▲ /山 /1 . 上 L — » I 、1人 —* r I •、一 * M - I—t - M” 1»1 ■ ny gnr~» ■* -r.l. /lLi /1. 

取惟化刑的柙夹对汉 M 时问令显者饪影啊，米用弟 i W 惟化 

剂反应时间确实最短. 



1. 一工厂有设备生产某种产品，连续五日记录了这三台设 

Mr ^ A _ ^ • — * / - ■备 _ / : y ：■*' # \ 、 

亩的母 H 仄茄半 （日甘 奴八 



r 7命 a 索 

r-f t /、 MM 1 ~ 

A, 

4. 1 

HQ 

4. 1 

4.9 

•^2 

6. 1 

5. 7 

5.4 

* «ki 

7.2 

-^3 

4. 5 

4.8 

4.8 

!■ 

5.1 




就 h 列教抿斗桥二合份各右子 S 荃桦荖 S ? fS 蒌桦永苹 

r 遢 ， ■ • ， ， - ^ I _■■ ■■ ■ ■ -_ • f—i v-M _ 鏵 / - |—I ■ i * ， i ▲ ^ I • 、 ir * ， f=^ j ■ a - *. ，豸， | » — 

2. 为了试制一种化工产品.在三种木同温度、四种不同压力下做试验， 

• 320 • 
























































































每一水平组合重复两次，得产品的收率数据如下 （％) 



问 ：温度 、压力及温度与压力的交互作用中哪些对收率有显著影响？（显著性 

\TT _ /\ /\ r 、 

小 T a—"W. vdj 

3. 在实际进行方差分析的计算时，为了计算的方便，常常对观测数据先 
作一线性变换.以单因素方差分析为例，令巧=(九 _ C ) A /， 其中 c，d 是固 
定常数 W 专0)，试用&表示出单因素的方差分析表. 

4. 在单因素方差分析中，若各水平下的试验重复数不相等，即有观测值 
: y lV ( z ‘= l ，2, …，以=1，2,…， r , ，这里 s 是水平个数， r , 是水平；的重复次 
数， r ,> l ). 这里 


ytj — "I + 〜 


t \ • ■ . ■ W A t ^ • • M . O O 詹 - tL-m. V 

{化）和立狈立冋分帀，心〜 AKO ， 〆 ） C〆 禾知入 

问： 在此情形下如何检验 H 。= jfi 2 = m = J ^. 

■ ■ - r 了 - - ■ 崔 ■ 

5. 在拉丁方设计中，设第 i 行第）列施加处理/得到的观测值为 
yij(n » 数学模型为 

. , _ y,jw =fx + a , + 戽 + y ; 十 〜， ij = 1，2， ••• yk 

親氣 1 _ 量 _ £ \ ft ammrn ^ _ lb 身， ^ ▲ ■ ，， O *fc. ， O t ^ • 1 __ 

具干和立独立冋分帀，〜〜 iva),d w 木郑 ） _a 

2 a « = ZIa = 2^ =0 

t=i j=i i =\ 

(注意给定拉丁方设计后 ， Z 由 i，i 唯一确定 ， Z = Kf ，）））. 令 


y 


k k 

l ▽ ▽ 

12- △%(/) 
K 1=1 j=l 


(全部数据的平均值) 


k 


yi -= 

• 1 
• k 

>=i 

(第 / 行全部数据的平均值) 

y-i = 

_ 1 
"k 

k 

〉 a a ⑺ 

i = i 

(第^列全部数据的平均值) 


* 

_ 处理为 Z 的全部数据之和 

yen - 



k • 




试证明下列恒等式 

k Jt k 

SS (〜0 -歹 ) 2 = 是 S (歹“ 一 歹) 2 + 是 S (歹 V _ 歹 ) 2 

i = l j = 1 t = 1 7 = 1 

k k k 

+ k ^( y (n - y ) 2 + EE (% ⑴ 一 t — 歹” 

/ =i i = i j = i 

-歹⑺+2歹) 2 

并用上述这些平方和列出拉丁方的方差分析表. 

6. 在冲天炉降低焦比的试验中，考察的指标是铁水温度.试验目的是 

-si** 」> ，/ a r^r? tfAr ire 山 JLt* m 白 -h^. atr rir rfn / \ /=r -LLL Zfe? t I, lT7t fi . 

J 5 E 同软 /N i & 反，陣 IIS 焦灭的 用星. 号软妝庶同 ® 八母 rJXL 描 CL 、 下. 

( mmH g ) 与风吡 （％) 这四 > 个因素对铁水温度的影垧.选出的四个因素都考 
察三个水平，即 




180 

240 

210 


风吡 底焦高度 



将这四个因素依次放在 L 9 (3 4 ) 的第1，2,3,4列上，就可得到试验计划.现将 
试验计划及按计划试验后得到的数据(铁水温度 （° C )) 列表 如下： 


^||-B Jvl nr Jvl nl^ 

试 ^\ 1 2 3 



• R9.2 • 


底焦高度 


铁水温度 


4 

1 ~ TTz ~ 1 369 



1 393 
1 385 
1 394 
1 394 

1 378 

* 

-• 八 -• 

1 ^yi 
1 411 


1 L 2 1 392 










试对上述试验数据进行分析. 

7. 为了考察四个因素 A , B ， C ， D 对指标 y 的影响.每个因素取两个水 
平（分别用 Ai 9 A Z ^Bi jB 2 fC \ jC 2 jD x 9 D 2 表示），将 A ， B ， C ， D 放在正交表 

K 2 7 ) 的第 1.2.4.5 列 h . 就可很轫试验1+创_盔个试验备件下做而汝试 

%J ' 一 ， ■ 才，_ ▼ — , _ ，一 ，一 ， __■■ ■■一 -• ■ ^ “ 、寸- | r ^- ， “ _ | 1 -# \X 'V ^ 

验.现将试验计划及试验得到的数据列在 下表： 



试对数据进行统计分析(希望提高指标值). 

8. 设 A = a ,) 是 L „(2” 型正交表且 n ~2, m =^ l , 试证明 n 必是4的 

倍数. 

9. 设八=认 7 )是[„(2”型正交表.令 

〜 i 2 j 当 A 。 = 1 

Al> = 11 . 

' ▲ 7 —I M 

-W 

A = ( A *；) 



试证明 ：（1) M 是 L 2 „(2 2 m +1 ) 型正 交表; 


•m 


m 








(2) 试构造出一张 L 16 (2 15 ) 型正交表. 

10. 设 ,4=( A 0 ) 是型正交表， 

r 2，^ A t; — 1 

^ S = 2 

\ ^ 7 - f 一 

,1,当 A 0 =3 
r 3, 当; W=l 

X t j =< 19 当 A ” = 2 ( ―‘切 i ， j ) 
、2，当 A t y = 3 

I 

A = (Xij ) » A = (Xij ) 

• AAA 

: AAA 

1 
2 

M— : AAA 
2 
3 

: AAA 

、 3 > 

(1) 试证明 M 是 L 3 n (3 3 m +1 ) 型正 ^ 表； 

(2) 试构造岀一张 L 27 (3 13 ) 型正交表. 


• ^24 


費 





第六章序贯分析初步 





_ ■ ■■ ▲ 1 f ▲ 上 ，秦 - 1 ■一 J.mm - i #■ ■盧 羼 

斤页万法的里安饪与网个要系 


大家知道，统计学里最基本的概念是总体与样本.总体常用 

咏士 ft 7 fr ： m/ 7 *rKsftirn rin 运 、>:*1 古 || 7 S ； M. mZ\.-Ar ifcfr 4 dH:^ 

waiyu 又里、现 waiyu w J 里 ，不 ％ y 晒，匕 口 yrr | 工疋 rnyj m jia^niwxd ， Tt* 

本则是由总体中抽取的（或观测到的）若干个个体（样单元）组成， 

1=1 丄 Art IT^r 4*rt 曰 / 曰 、 -r*^ 士 “ J4A -A- *-U crrt >^w 44A M 人 m I 

匕定出一组 waivL 戈 : 里 u 口 j 里 j 术次 y 画，忏平十 3 try 忏平兀 n ’ 奴叫 


做榉本量.统计举的某本仟备县诵讨样本夹椎涮或堂搌总体的恃 


性.一个很基本的问题是 :样本 量要取多大？当然样本量越大，对 

* 

㈡ 伐:的了魅就械玄.田 ihk 对故彼你.屮.的堆胳 + tr 就械 1 ST 羞：伯 县抽 

iii *、 n " m v -i /m 雇 Mru7 ，，嚙 .%^*、 n ■厂•- « v ,j h - »-y 1 - si^u rvt ^ -# y ^ t-r jhhi 

掉 (或进行观测）是需要费用的，抽样大，耗费就越大.合理的 


提法是，在保证所得结论有足够可靠性的前提下，应使得抽样量越 

_ m 

小越好.通常的统计方法都是在抽样之前预先给定抽样量的大 


小，实践表明，这种固定样本量的方法能解决很多问题，但在有些 
情况下使用这种方法导致不必要的浪费.还存在这样的情 况：使 
用固定样本量方法(无论样本量多大），根本不能解决问题.请看 


下列例子. 

j / 、人 It L. I - I 、倉 - \ . ▲ J — 、 、 rt ― M * t 丨丨 -— ■— ♦ v t 黑 ，》 r v . ■ 

m i . u 早瓦捆砰万茱） 1 父有一邢广疝 c ^ i \ 忏， i \ 很 x ) 搿 

经验收检验.每个产品经过检验可判定为合格还是不 合格. 最简 

〆 鑛 

单的验收方案是选定两个整数从该批产品中随机抽取 n 
件，如果这 n 件中所含的不合格品件数 d>c ，则拒收该批 产品； 若 
，则接收该批产品.很明显，这个验收方案的样本量(抽样量） 

B . /a 4tn ffl -I-. 4rlt zni _ IfU^ -^U zni 

疋凹疋 trj 难议 n,u± 疋江畑汗 rrj;tx 任丁术不 ： ra 戈 u 打 rr 肌太 ， j 

了 c + 1 个不合格品，就没有必要再往下抽样.换句话说，在有些 





情说下事先固定样本量要造成浪费.这就启示我们：应根据抽样 

I k fc ■ • • • # ^ 難 _ ■« • - H> i ■ ft* 1 • w 磨 

过桎中出观的情况术厌足抽样量. 

例 1.2 研究一枚不匀称的硬 ; 币.我们把有币值的一面叫正 
面，另一面叫反面.在桌上任意抛掷一次，问 ：正面 朝上的概率是 

否大于 j ? 我们可以用随机变量 X 刻画这枚硬币.当正面朝上时, 

X = l : 反面朝 fc 时 X «=0, 记/当然0<办<1.上述问题 

, - ^ w w * . 賢， — 又 - - 一 _ - 

•*, v • V • 

•.一 

耵伙士烚验雰假份从 . o < r />< r 4 f 各柽低份县从，.若 

^ I ^ Y 1 -^* w i . 'S iil^v 一 — 1 ，曹 ^ 、冬乙 y mh -# I I 。 ^ ^ jr 、 ) ， r—• 

^ • 

拒绝 Hi ，则表明正面朝上的概率大于 + ; 若接受，则表明正面 

La 

V 

*n u 从碰 由丄工 1 ★) 卄亡仏 必 d 斗包“ *Wt 人择”油曰、7；宙 /n 
别丄 prjm 千 ， j、j ~2* jze 1 j m 3 MM'j ^ xg ： jm — i 什肌疋 i 丄 

竟拋掷一次.给宙 / l 、 Tf 教 J 0< a <^ r ), m 丨县否有固定样本量的 

，« -w | ，~ f — f / ™ ™ ， i - - » ■ i r 9 w • • w " ^ r ■ r w ■* ■ ■ ■ ▼ 

\ ^ / 

I 

检验法使得犯两类错误的概率都一致小于 《 呢？可以证明，这个 

囈■春 两 

I 

^ - -*■ ■ ■ • ，■ ■■ * • * * 1 % ^ _ _ _ _ i . % 1 •蠢 k m . »‘* ■■团幽 V V # n_ _ ■蠢 i • II I . ... » • fc ■ 塵 . It i •磨 • 、 # > > '» # 里 I . t 

问题的答茱是否足的，也就是说，尤论预无固足的梓不量有多大， 

+ b 壬饮不室 

LUi^LJ vi g 宁 • 

实际上，设 Xi ， X 2 , …，尤 是 X 的样本是样本量等于71的 

不由城 R 

M AC.<5\-t=L 

sup P p (( X 19 -, X n ) eW ) <a 
(这里 i %04) 表示参数是 f 时事件 A 的概率 )• 

- ▲ Bk 

因为 

p r rv ... y 、乙 w 、 

上户 \\2 五 1 ， f ^3. n y rv / 

= 2 />? x； (i — p ) n ~? x > 

✓ v Twr 

kxj ， … ,x n ) t yy 

是 P 的连续函数（注意，（兄，…， x „) 的可能值共有 2” 个），于是 

1;m P (d ... V 、乙 W^、= 1； m P ((Y. ... . V 、匚 TVM 

AX1XX x p \ V 1 ? J fr / xiiA* j. P \ \ i J y ^3. n y wj / 

^ 1 — a 〉 音 〉 a 

— o oz? 丛 

w 0^0 w 



这里 \ ^是 W 的余集.故采用否定域 W 犯第二类错误的概率不 

AI-1 LtL, T - —L-. — 

目 B 一现观个人丁 a . 

例1,3设 X 〜〜(^，(/^//、(^都未知.给定7€(0，1)及乙> 

r\ ■ 、一 I C3 1 * -■/ * t iTt j1 . ^3. 丄 t tn3 /-^-* ». >* A-rt 广 / xr* "xr \ y 'xr 

U ，| 口』： / i 定哲仴•回疋件个里的直谓 12 SJ 曰 JL^Pi ^ Ai ，…， A n )， 和 kAj ，…， 
D 1 俅猎晋佶 7 k 平县 y . l^r 问宽麽不轺付 L ? 可 Wii 下明.汶个问颍 

- ft ^ ^ J I W ■ ~ i |—f / _ ， I w 9 / i ^ ^ / P /^« W ^ IV , ▼， ， 攀 ^ •<« , I I # ^ f 

的答案是否定的.也就是说，无论固定的样本量多大，不存在固定 
宽度的置信区间（详见 §3). 

上述三个例子是有代表性的，表明了固定样本量方法的局限 
性.第一个例子表明固定样本量方法有时效率不高，第二、三个 
例子表明固定样未量方法有时无能为力.统计学发展史上的一 
个重要里程碑就是序贯方法的出现.人们在20世纪40年代普 


遍认识到样本量不必预先固定，可以根据抽样（或观测）过程出 


现的情况来决定何时停止抽样（或观测），也就是说样本量是一 
个随机变量，这样得到的样本是一个一个地逐次得到的，叫做序 
贯样本.可以证明，在例 1. 2中存在基于序贯样本的检验方法, 
其两类错误概率均一致不超过 a ， 在例 1. 3中存在基于序贯样本 
的固定宽度的置信区间. 

序贯分析（或者说统计中的序贯方法）正是研究如何得到和 
利用序贯样本进行统计推断（或选择）的统计分支.在假设检 

私 Tt 抓从 々 i ： 2 丄虫 “ >4t I 、二 i ms m 古舟 士亡 一 t* 斗 i&/v 士 

迦、％双 '1 口 H J 乂丈 — WL^J^JLV\ 方 ytKl w J 峨王， 7 丁 贝 7T1VI 刀広 — WL^H 

， rM 

两个组成部分(两个要素） ：停 止法则 O 与判决法则.停止法则告 

’ 匕 -fix />-! -/r* irf-L XL / ， U 、从 Z 一 'rsct vl* ATItl / ― U- JOA \ JC.A* 、_L —U* /rrr n_L /iV _ | — 

w 双 iu ，仕刈思件 进仃 您仇观观 k 现畑忤；的以往 ti 卩」 o'j r?in r 

夹：判 决法咖刚告诉我们.枏抿俸 I 卜时徨剞的令部救抿（序侰榉 

，_ _ r ， ^ > • — 1 jt ，署才 r - % w y i ^ 11 -# f i—• i * i * ' ^ i...i, ，’， ▼ t—• 、 ， ， —^ ^ i p 

t , 

I _ 、 —> . _\ A ^ t . ▲ •一 # m ## ^ - • #、_ kf.〆 - IV t 參寶 ' l-n# 〆 I i. ^ t A #lt-t 、 rt #1 、 . 

不）对思体应卯佃作出珉断现远择 c 按受:现怛钯一个假坟，佰 tr 

? i 


①有些统计问题里（见§ 4) 不明确提出停止法则，允许抽样（或观测）无限进行 

下去 . 而盔汝（或毎舟）加佰柚烊 （ 或观淛）刼需萆枏据亦收少前渴 SI 的仝部救抿才能确 

■ _， , ■ ■ ■ 蠔 V 、 、 *->^1 广 * I V ^ P - *' V I 、 1 - ■ 琴 I 'W-f » ■■•_■* 14 ^ P ^ ^ ^ — ■— 1 髻 ^ ^7 •# 

定.这种递推方法也属于序贯分析的菹围.我们可以这样设想， k 然递推过程可以无 

者 - * i 

lfl_J %jul >:— * 1 * I - 1 * * ^ ^ r r *. / 蘑- i"rt W L -1 • ta * v u . ^― * j A rrrt ， >rvi r 一 / t ^ \ v ^- -■ * 丨 \ r^t uw I 、 _ k ^ j 、_ ■ ■ 幽 

隈 边 仃 p 云，仕头怀便用叮也定近仃到一疋 ® 「杈 （ wjjuierr 蔘奴叮误爱疋咿小）杌 t ? 卜 

来，因而还是有一个停止法则在起作用，不过未明确提出罢了. 


^97 

w f 





参数等等). 

、》/▲ I. 上 m Hrt 、上 . I >/_t* m»l I— 、 U»l Et»r >uU nt»l rtizi ^ /*r . i >a - r^ftl JC.A. 、、/ 上 n 

默子工•即呷畑边勺刊別 Ti： 则％了 mttriuu 的疋乂训 

下:设 尤，不，…是独立同分布的随机变量列 （足 与总体X有相 

t -^ , , # t _ M. _ ^ _ 嫌 r ■ . M — 孤 ■赢 >—!# »— # ku\ ^ tf ^ t ft—ft^fe 一 A J . 秦 t I* ■ tr . _A ^,』 廬 J * / 

冋的分布）.杯随机雙量 r 是怜止法则，右 r M 取非灾整奴 mUM 

可取值00)，而且 rgO, 或1>1，对一切《>1，存在集合 B„(Borel 
集> 使得 

{r < w }= { (Xi ，…， X„) 6 B n } (1.1) 

(1.1) 式的直观意义是：!•是否大于71仅由观测值 Xi ，“ •，尤 

•rfr ~rh^ r^-t I—^ bi/L r»nt M3il 上 A» V V 、-^ C ! 口 产白 " ，f )/4 - tn»l ~TL 

不 W 疋， IIIJ g 间不她測 tfiJ A„+1 ， A„+2 ， …兀大 • 込衣明厅 in 依央 !J 夕 J 

县不侬皰干将夹的晡机亦畺.串 r =0 时.丟示不讲杆仟何观涮 

，， V w ▼ . ^ ， | ^ _ w w ▼ f H#r w ^ ■_ ■ ^ ， 111 ■■ 11 _■ ， w ~ ^ f - ^ r -w ~ v ， 9 ■ _ p ▼ , ， v 了 ▼ 

(或抽样). 

例 1 .参设兄，尤，…是随机变量列， B 是直线上的集合 
(Borel 集）， 

n = in {{ n：n ^ 1 , X n ^： B } 

(当不存在 n 使得 X „ eB 时规定 n =00), 

r 2 = inf {n ： w ^ 1, X^! 6B} 

(当不存在 n 使得 X n + l eB 时规定 r 2 =⑺），则对一切 rz>l, 

71 «+1 

r 、— I I ( \r y— r> ^ r / 」— I I ( v ^ id \ 

\Tl ^ tjf \A Z •亡 D j ， \TZ yj X^iKZ Of 

i = f £=1 

-=n* m t=i _ r V-L rrt»t Art —r- t=t Adir _ 1 vlX. rrt»l 

口 J 見 ri 龙挖止汰则 ，r 2 —取个定伊 it 汰则. 

称停止法则 r 是封闭’的，若它是有限的，即 ’ 

P(r< ^) = 1 

我们最关心封闭的停止法则.不过肴时不封闭的（叫做开放 
的)停止法则也是有实'际意义的. 

显然，若 r=n， 则 r 也是停止法则，故固定样本量情形是 一 ^种 
特殊情形. 

_ 

/^r *1 I7t»l |L* -I ri_L ^JTI / AAr /^r \ 

m 広则 m 孙庁止叼间孙庁 b、j 入 

怎榉描沭判决法咖呢？最一般情形县给宙其个韭空集合 A 

严 ， p ， r • 1 ^ 1 _ • ， • — , ,， ， • ^ f-^w , ， _ ▼ ■ , ■ ■ ▼ r ■ • 

(叫做行动空间）， A 中的元素叫做“行动”.所谓判决法则，乃是 



取值于空间 A 的映射 3=以兄，…， 又）.换句话说，判决法则 d 

/i*. ^li /_、-r -ml rfa 1 J^4 -I- / \ »-Vf* 、士 -tZ ♦ / L /▲ 44A AAt 

百外议 II j : 仕 1 守羽 nr 贝忏牛、 Ai ，…， Ar ■； / 口 M 025 评 IT 忏 WV 

“行动”. 

#V- r >-t ir-t^i 赢 、tht w. t t _ t—t^t ， A t - ,1 丨 ,- - tv. • nri 赢 - \ ^ y t ^ 盧 

悖止沄则 r 与判厌沄则^甘任一起柯趿厅页万法 A ，记 

A = (r ^ /7^ 1 

y Zi x Cr 7 • 

读者在这里可能感到停止法则和判决法则的定义过于抽象， 

in^a ^f F^rSf S O 66 给勺油丈她： lffl42 你世 is ：： 士 Tfffy^ian 
i±=LAta 人^口 w ^ ^ wy 卞 q 肌， 1 、學 ^ai ； trt*TH 予 i 州心 • 

“假设检验”乃是一种两判决问题，即行动空间 A 由两个元素 

LU rrt^ A _/ _ ^ \ - TtHAWOl -祕也 肋 JZLtT _ Tffl 如 垃加 ■: ZV tJ 

\ ai ， a 2 /，ai ni ^ u 2 tP ： w jcm n 2 

( H , 是的备择假设）. § 2 中介绍序贯概率比检验，这是最重 

^ ^- W ▼ w ■ — — w ， w — , ■ ■'w ▼ » r W - - ’- ^- - r ■ — — ■ 

要的序贯检验法.§3中介绍序贯估计和随机逼近.我们的介绍 

县人门株新的 . W 仝而、軍衮铳的论沬萆用剞相玄湖 I 苷论和现佧概 

， ，_ 钃 |~«^ ^ i • m-m 、 ，磉 、 m < r u I 鱟 u»* I ■ ， I m I v^i* 

率论知识，读者对此如有兴趣可参阅 [8]. 

§2序贯概率比检验 CSPRT ) 

• « 


最基本的序贯方法是序贯分析奠基人 A . Wald 于1943〜 
1945年间提出的序贯概率比检验.迹是适应第二次世界大战期 
间美国军火生产中质量检验工作的需要而创造出来的. 

、rt -w* t- J. t. # \ , / • j >■ • _ l» t j* —^ 1 ✓ v - |t 八 〆 v ■ * >t • V • ^Jfrt 

U a 的分伟钳皮 C 现楸半凼奴）定 / iCx ) 现 / 2 Cx )， 到低是哪 

一个？不知道.我们来检验假设/^:力是真正的分布密度（概率 

函数).对立假设是 h 2: / 2 是真正的分布密度(概傘函数). 

* 

对 X 进行观测得到 X i ， x 2 ，…， fe 们是独立同分布的，共崗的 
分布密度(或概率函数)是7\或/ 2 . 

j 

止 -^ 込 71 人 T T 二占 /|\1 Jbll I 从）上 _& 

yy j 恤题 1 ，今応 1 以於「匕坑 tt 里： 


n 


A „= TT / 2 < X t ；)/TT /l ( Xi ) (n > 1) 


( 2 . 1 ) 


f=l 


在这里我们采用通常的 习惯： 随机变量与随机变量的观测值在记 
号上不加区别.不，•” ，^ 既代表《个随机变量又代表这 n 个随 



机变量的观测值(样本值). 


4*r» Ra 7Ttl 人 T^m yi3i\ /±r 'tr -\r ±t~3 _U=1 -M* A*" XA. ' t n I -rfU 

灿术 1 守到 J w ， r 观侧但 Ai ，•” , ，依做热沖 try 丄 n - r 引理， 

最好的检验法是似然比检验，即找出临界值 C ， 当; U > C 时拒绝 

T T A i k-» I. 丄 vrt T W 廛 WW T \ 1 —^ I t t . ^^ t - WtL ^ 'J^ - IT 及 f —i \ J_L. 

；a A „^ U 叮撗艾 rti . A . Wald 对 ]«： 万沄近仃 J 里 X 叹近 • 
他的甚太 M 相县.劣 A 相女时拓錐.劣 a 相 / hB 计怯磬.当 

I w* *-* ■ * I • — I ,、 7| I *^V / 、, • y V *—* -^1—* • • 1 7 1 , » 71 I ►V ' ^ » - <4 — — I 7 —| 

A ,. 不太大、也不太小时就不忙做结论而再观测（抽样）一次，往下 

1 ,，.吉 5 M 宜一 也 /Pl 缺咏 S 攸+流 ra 攸/ I 、士 iP 施七 TT 袖祀_ 

^y\y\j, ，、 n~r 1 y Jtt* usa pu yvi_ •^jr / Atr ^cx ^4 T /；/ u - • »jn^ vv ic/u j 

给定两个常数 A ， B (0< A < l < B < oo )， Wald 提出的检验法的 

會故 也聰且 瓜 y 且笛一免抓刪但础 & fi 估 44* /n ^ U / 

z ^ Pia 抓/^ :认 1 yvJ w a?o wj j ='4 oy is . > vi 开 i 认 /(、々 mj ai v yu 

(2.1))， 如果 


Ai ^B 

r 

则停止观测并拒绝假 S ;如果 


Ai 

则停止观测并接受假设;如果 


A < Ai<B 


则进行第二次观测，得观测值 x 2 ，计算似然比 A 2 (见（2.1))，如果 


a 2 ^b 

则停止观测并拒绝 H 1; 如果 

a 2 <a 

Rlil >tit IU 7RI ^Hil ±fi ^ J-T . -frn M 

yy4 nr Jx-, AOiWjy I 汉人 -»l ^ >h>t^ 

^ # #■ 

a < a 2 <b 

* ¥ 

mir >ff 么：雄 r 一 ▲ am 、加 || am Mil v _ iftnitu 士 n 田 >ff _i 人 

yvj jzli j 所二 w 肌 Ufa ， i 寸肌 t^J ia 八 3 . . 取地，义 w 不 jzlij j n 丄 I 

變 u 

观测不能做出停止观测并拒绝或接 受 Hi 的决定，则进行第72次 

- * 

rtm Mil 彳日 rrnrr ^raa Mr v ^ /ni Jkh. i 、 4«rr ps 、 T"> mtl /^r .i rtm Mil -w* 

桃伙！ j ， i 守观 {Kum a” ： tnr 畀 i 以 ? ^Ki 八 ” • 术 mrrin^m^r 

拒绝凡 ：如果 咖停 Ih 观测并接等从；如果 A<X<B, 则 

， ■ ■ - ▲ r - p - r t ，，- 9 wrnmtrnmmmm - wtfr _ A W ^ ~ - *- * W - , ， 

» I ■- 

进行第 W+1 次观测，得观测值 x n+1 …… 

宙兑 2.1 卜沭拾验法叫做痒曾椹銮屮蛤验 （SPRT). 簡 iPA 

，，國 r ■ — — !麗 U .丨 ■ _ ▲ Imr I - 1* v ， L I ^ | l^rv / ^ U | | ' 1* W “ 一 — ' ， I ^ / ♦ 

S(A，B). 它的停止法则是 


=inf {w：n ^ 1» A» 0 (A>B) } (2.2) 






(若对一切 n ^ l , A„G ( A , B ) ，则规定 r * = oo ) ，判决法则是 

f 拒绝氏，当 A ， 

d * =< (2. 3) 

I 接受故，当 k <A 

从 S ( A ， B ), 的定义看出，最要紧的是找出停止法则的具体表 
达式. 

例 2.1 伯努利分布情形. ： 

设 X 取值0或 1, P ( X =1)= P =1 — P(X = 0) , 0 〈/ ><1，故 
X 的概率函数 /(X, 夕） = P ( X = x ) = /^(l — />)^(工= 0,1)，考虑 
检验问题： 

Hi : p = p \^ H 2 : P = p 2 

泣坦 (X ti、t <T"1 . . /jn 县 F 1 . 知的 7% . /r« . … 基 5T 的她 "^T 观 

_ j—— v ^ 丄 、 t Ci ^* 7/^1 7 匕 Ci " v • i 7 c 7 ‘麗 ^ y w 

测序列，从 (2.1) 知 

n n 

^n— XX f^ Xi ，夕 2 ) / II f^ X i ^P\ ) t 

i=l i=l 

/ t>o \ $n / 1 —— t)o \ 

=[yj 

n - 

这里 s „=^ Xi ，于是 In A „ — 5„ln { n ~ 给定 

A A ^ 1 / ID /s^ 

W 、， L 、 丄、 U ， Y 

i 1 一 P ? 
in -—— 

c ___ 1 ~ />! 

C l n 色 _ l n ^i 

Pi i~/>l 

In R 

d \ = :- 

l n Pl - l n \nPl 

Pi 1-pl 

, _ In A 

d2= ~^ i — 人 

In ^ - In ^~~^ 

Pi 1 -Pi 


M 7 

vx ▲ 


參 



=02+(5^， A rt =cn + ( i 2 

曰 Zm r\ J 、八 J ^ r\ T* Ttftr :^ 山 、 D AM 女 "ffi At M* 曰 _ E) 

c/u, ai^-w, “ 2 、 ^,1 、雁眉 00 八 ” 夕 d trj 兀女氷 rr 疋八”； 

A „< A 的充要条件是 h < A „ ，故 SPRT 的停止法则是 

r* =inf{n：n > i , 5„ 6 (A n ,K n ) } 

我们可 Dlffl ® 夹类录汶个掄臉古宏 _ 阐17由措泌烷実录柚榉骨. 

， ，，，, I, »—■ , _ ▼ 4 ，必 ，- | 1-1^. ^LZ^m. ■ • 1 I 秦， | 1 _ w ，•^ T <4 I I _ ■ ■ 1 / 

纵坐标是样 本和〜 的值.当点(〃，〜）落在两条平行直线之间时继 

錄油样门 ID 姍 h .本_值山油样门 E 遍、 

<^s JKM |丁 \ /VOil^N j y y t-1 y\'4 i t »■ JkM IT \ /VUIT^'J / • 



图 17 


例 2. 2 正态分布情形. 
设 X 〜 N ( dA )，06 (-c 


，〜），分布密度是 


/( 』官… 


考虑检验问题 


Hi ： 0 = di 4 ^ H 2 16=62 


、 、一 i~r» 六 ^ 、 rt •» r- At. 、- -»rrr 、 i3>! ■ > * It ✓ r\ , 、 JU»» 

这里的 < J / 2 . 汉 Xi ， X Z ， …定 A 的 3 ffi 亙观测厅列.从 U . U 沖 


71 71 

A„= IX/(A ， 02)/IX f(OCi，dO 


\ Ti ix r e i 


Fl 

tS (x « _ ^i 


于是 


^2 



In X n = {d2 — d\)s n + ^-(^1 — 劣）， 


n 


这里不难推知， S ( A ， B ) 的停止法则是 

1 n . 

r* = inf {n：n ^ 1, s n ^ (A n ，及„) } ，其中 

_ 

A d\ + 02 I In A 

An = — z ^ n + e7 ^ d ； 

D 0i+02 I In B 
反=— T~ w + ^ : 

、 - x* 人 4 ^v tt 人 >/-u -zrr ncr n^t i o 士 — ^ J*« -nr* 

込， | 、 155 瓶？用团丄 0 衣 ; ^ 304 「• 



图 18 


从上述例子看出，序贫概率比检验的实施并不复杂，它仅仅依 
赖于事先选定的常数 A 与 B . 怎样选定 A、B 呢？这就需要仔细 
研究 SPRT 的性质.很自然地有下列四个 问题： 

(1) 是否有限步后一定会停止观测（抽样）？即是否成立 

■ 

Piiz * <C°°) = 1( 纟 = 1，2)，这里 P/(A) 表 ttc X"的真实分布密度（或 
概率函数)是兑 (X) 时事件 A 的概率. 

(2) 如何 计算尺 （〆 O d ，A r * <A). 通常记^=厂（^ <oo, 
A r * ^B),/?=P 2 (r*<^, A r - <A ). 它们是两类错误的概率.我 

/•、™l -^0 4Ji t f I , r\ A D —V iVrf AM I I ■I'R -fcP? LA^ AM n ^fr 

IU 布里仪 EQ a、p 3 八 、 D x^iojtrj 大尔， / AIIIJTRIW 辑疋 trj a、p 不洲疋 

A.B. 

* 

(3) 如何计算平均样本量 £： ir # (〗=1，2)，这里瓦是与 A 相 
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应的数学期望.自然希望£：:，越小越好. 


/ A \ ^ O / A n \ -t=r t=t /4^ ttt ,\jU r> -tr HZ. 4^w TtA. )/4* Ll/ O'TIT^ ^ rz* 

K^J oriw 1WJ VL istTJ ： :书儿但题広 PLoriM 10 ： 女 

“ 优”？ 、 

I 

Ar^ Ll 厶 'TTT 、丄 iLL^ •、 — I 口 7T rtO 八 人 -4=F，L- -tlTt 1-^ 口 r^r\ 上“ TTT i^rP 二 ■■广 / f ▲ 

忑忤 W 九込空 I 円越 i M 儿了 一垂 + 观 M 定 ：orKi tfj 霄九 Kim 

为随机游动的研软.从 (2.1) 知 

， ▼ 谬 V irv* /I r ， ▼ ，， i ^ ， ，/ ， ' ▼ — ^ ，'- 曹 

In A „= ^]ln ~ 2 - ( n ^ l ) 

1 /l 

令 


Z{ = In 


fliXj ) 

fi ( 工 i) 



Z n = In 又 „ 〒 > : Z{ (72 > 1) 

， i 

注意 Zl ， Z 2 ，…是相互独立同分布随机变量列，{心 ， W >1 } 就是通 
常所谓的随机游动，而 S ( A ， B ) 的停止法则恰好是 ，= infU : n > 
l ， Z „ e ( ln 义，1115)}.，即随机游动首次离开区间（111儿111 B ) 的 

时刻. 

下面先对随机游动进行一番研究，然后再论述 SPRT 的 
性质. 

引理 2.1( Wald 引理）设 r 是随机游动的任一停 
止时间，即对一切，有 Borel 集艮 使得 

< 少， 1 ( / rF rz 、， i") 1 

\ r w / = u 厶 1 ， … ，厶 n ??cD„/ 

若存在且 Er < oo , 则有 

. EZ r = EZi • Et (2. 4) 

证明：记 Jo + = max (« r ，0) ， x ~ = max ( —: r ，0) ，记 

Zi = Zi — Zt-i (t 1) , Z 0 = 0 

~r*. 

w 丁 

{ r ^ i ] = {( Z : } 

4-i^ r / '^ • 、 \— 4*o -cr 乂山 / 、rV m t -sfc ： 、 a aa» 一也 iii- 4^ \ tzn n» 

fix Zi Tfl _ a ^! U ^ ZA 込生 Ja 衣 ZTv/i tTJ 小 T 土，饥以 


E (2 jzt )= E (2^ I { ^ 


i ) 



• M4 • 



= 2]E(J (r ^ 0 • zt) 

i = 1 

oo 

=y^jPir ^ i) • Ezt=Ezt • Et 


同理 E(^zT)=EzT - Et 

i=i 

由干 Kzt 中 S 少一 ' 个有限，故 

• - w ~W X ’ ▲ w ■ ■， w w — w ▼ 


17*7 — T7 ( \ 飞 

L 厶 r —D V 




= EZ, - Et. 证毕. 

引理 2.2 设/是随机游动的任一停止时间.若 
EZ^ =0, EZ\ <oo , £ r <oo , 贝 ij ‘ 

* A ^ -W 

' EZ\=EZ\ • Et (2.5) 

证明：使用记号 a A 6 = min ( a ，6). 易知 


Z rKn =Yj I^zj ( zj ^ Zj - Zj ^ 9 Z 0 =0) 

>=i 


彖一^ 圃 ■▲■■■• _ ■ • . %■ i w ^ 一 # - 

仕葸回足 n>m 夕0,易知 


n 


E(Z.^-Z.^) 2 =E( V L 〜、 

tt ，‘ L # \，，. - \ t J ' J / 

j = m~H 


n 


V rr t _ 丰 

/ A “ 厂〜 J ， I 

j = m +1 


/ j “、 ▲ 、 w 〜 i 〜』 ， 
m<Ci<ij^：n 


由于 ^ Z j 是相互独立的，故 


、 f/ • ''■Nw ， rr_L 

日 j / z n 、 j 赘 

于是 


E(I(r^nZ 2 i)=Ez 2 i • E(J (r ^n) 

' — 1 W * ^ L 一-一 , ' • - 


E(j ( 必 ) 叫） =£(J( 必 )4) • Ezj=0 


n 

ECZ^-Z rAm y=Ezl . 2 E(I u>j )) 

j = mi-l 

= Ez] (E(r A n) — E(r !\ m)) (2. 6) 


參 
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令 n . 


得到 


T?< / rz rz 


A m 


/ ry 2 / T7* Tl* / a _ _ \ \ 

^ r , z \ v^r — r^KT t \ mj ; 


于是 


Y\mK(Z. 一 Z_a„) 

-- 、- t - !>/、"《 , 


从而 


m 


EZ 2 T = limE(Z t , m ) 


m 


另一方面，在 （2.6) 中令 m =0 得 EZ ^= f ：4 • E ( rAn ). 

* 

* ( 

于是 

EZ 2 T =\imEzl • E(t A m)=EZ? - Ex 


m 


证毕 • 


给定区间 ( a ，6)， — oo < a <0<6< oo . 我们来研究啤机游动 
{ Z „， w > l } 首次离开区间 Gz ，6) 的时刻 r * ，即 

r* = in{{n：n ^ 1, Z n ^ (a,6) } (2.7) 

引理 2.3( Stein ) 设 =0)<1，则存在常数 M >0, r > 

0,使得 


P(r*> «) < Me~ rw (一切 n ) (2.8) 

证明：首先指出，存在 m ^ l 使得 P(\Z m \ >6— a )=/>>0. 
实际上，既然 PCZ , =0)<1，故有 S >0 满庠 P ( |乙 | >幻>0,取 

就行了.这是因为 

A - — -嘗， 


P(Z m > b — a)^ P(zi > 8 ， z 2 > 8, …， z m > 8 、 

=[ p(^>^)] m • 

同理 P(Z m 〈 —— (6 —— a) lP(^i<C —— o )] TO ，故 P ( Z m 二 >6 —— a) 二 >()• 


任给定 n > m ，令 !， j G = (a ， 6) ， 则 

777 

m m v 

鷥 mm 

P(r m > n) = P(Zi G io, …， 6 Jo) 

〆 d/ 7 广 r 7 i \ 

义 i \^ m io ， ^lm ^0 9 ' 9^gm ^0 / 

^ P( \ Zm\^b — I Z 2m ~ Z m I < 6 — a ，…， 

, W 了 W , - _ , w 

I ^qm ^j ^ ^ ) 

• 2 狀 • 

\A 




= lP(\Z m \^b-a)y 

= a - p) q < a - p)-~ l . 

若 夕<1 ，则 

P(t* n) -r-^ — exp(— —In - —- | (w 〉 m) 

l — P \ rn l — pj 

若/>=1，则 

P ( t* ^ D ( n m ^ 

丄 X C v \ ，丨 • • •/ ， 

总之存在 M>0,»0 使得 (2. 8) 成立. 证毕 • 

引理 2.4 设户(厶=0)<1，则 P (，< m ) = l ， 且存在 A >0 


伸得 Ee Ar# < 00 ,从而 r # 的一切阶矩均有限.- 

gjj* _ V ^ r f / W - - ~W — r - ^ ▼ _ ， ■ ， w ■ ■ •▼- 

证明 ：可从 (2: 8) 直接推出. 、 

引捆1 5( 序侰分析某太佰等式）芒 m ( t ) = E ^ < 00 , 

_ _ - - ， v / V I —_ I r ^ ^ - f—q 丁 ' - , - 1 , 

P ( Z X =0)<1且 〆 0>1(对某个 r ) ，则 

E ( e ^* / (,< p ( t)) T ) = 1 (2. 9) 

其中 f 由 （2. 7) 确定. 

证明：记 z k = Z k — Z k - 1 ， Z Q =0, 则 
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E(hr 
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^ (r 
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e * 1) 

彡出） n、、k } 

\cp\^j j 」j 


( 2 . 10 ) 


* {r # >k }={ Z 1 ^ (a，6) ，…，厶- ! 6 ( a ， b ) } 知随机变量 


_£Z. , ^tz t 

T e n e * 

i(r » • (㈣) 卜 1 与 ^O) 


相互独立，从而 

x U ^ k ) 




{( pit ) ) k J 
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再利用 （2. 10) 我们得 


E 


/< 


# 




{( pit )) 




-E 


e 1 


n 


祷 


{( pit )) 


a —T3CT 、 I ， * 、^ rt_L r7 7 x-f / . \1 4-/^ 

力 一刀凹 ，彐 r 口、 j ，厶„ — a ， 乂 丄 ， ex 




# 


(p ⑴广 


<e 




P ( r * >^)-^0( 


所以 （2. 9) 成立. 


证毕. 


对于随机游动 { Z „，〃>1}， 我们最关心的是计算 L = P ( Z t ^ < 


a ) 及, 抆里， 县由 （2. 7) 宙2的.要給出一般惰形下的精确 

_ — ， _i ■ • — 一 ， r —■ ’ - r ， ▼ ■ . ▼ - — ^ ^ V ―1 ■ f ， _ p ， ， ■ w ■* ▼ __， - ， ^ 

计算公式是困难的，但我们可给出有实用价值的近似公式. 

W 

设 P(Zi = 0 ) < 1 ， 有 G 专0使得 〆(。 ） = Ee ( o z i f 1 ， 则有下列 
近似公式：， * 


e r o A — 1 

(1) l =4 t , ~~ ^ 

e ，『 — e *°* 


( 2 . 11 ) 


这里 L = P ( Z r * < a )； 

(2) EZ ，= d - hL ( a ~3)； (2. 12) 

(3) 若 £： 乙专 0,那么 


Et 


长 


/ 6 + L(a — b ) 
= EZ , 


(4) 若從=0, EZ ?< oo , 那么 


Kt 


簧 • 


La 2 H - ( 1 — b ) b 2 
~~ ~ EZ \ 


(2. 13) 


(2. 14) 


这些近似公式是怎样推导出来的呢？由基本恒等式 （2. 9) 知 

« * 

，餐 7 、 — — t ^ • 人 / r-r ^ 0 ^ \ W ||| /# .* \丨 /-tf 1 螫 . /*!> » / > * f 入 

iUew )=1，仕果甘 （ Z r * 丨上用 a 忭刀的近似俚，任果甘 

{ Z r * >6} 上用6作为 Z r * 的近似值，于是有 





e^dP + 



e^dP = 1 

> b } 


由此即得到 （2: 11), 

同理可得到 （2. 12). 再利用引理 2. 1和引理 2. 2即可得到 
(2. 13),(2. 14). 


• 338 • 



现在利用随机游动的性质导出 SPRT 的统计特性，仍沿用以 


口 

刖 trjTC^r. 


定理 2.1 对于 f = l ，2 均有 

W %. / 从 ^ V 

dr” < 


_ 铸 

TT' _ Ar _ / tt—I* i-l* r\ \ 


E t ( T n k < 


( 一 ^切々 > 1) 


证 明：令 A = In [/ 2 ix t )/ f \ U ) ] ， Z n = ln A ” = 々 + … + ‘， 
a = lnA f 6 = 111仏则{乙， n > l } 是随机游动且 

r * = inf { n ：« ^ 1, Z „ ^ ( a f d ) } 

当乙 是连续型随机变量时， Vi(^)In ，利用不等 

J T \\X) 


式 In x < ix — l ( x ^>0 且 1) ，知 

T ?» rz ^ r / \ f 2 ( 工） i "I i r\ 

J\ kooj -7-7~7 —丄 |ax = u 

J L/i ( 工） 」 

故厂 （乙 =0)<1. 当乙是离散型时也有同样的结论.利用引理 
2.4 知 


Pi ( r * < oo ) = l 且 £^ e Ar < 
Ei ( r # Y〈oa 


(某个 A >0) 


同理知 


y m. ^ x ， t— ♦ 1— — y -I I* 入 八 x 

〈 oo; = l _a L 2 e A ‘ < 00 A > u; 


E z (v^) k < 


证毕. 


定理 2.2 对于 S(A，B) 而言，有下列关系式 

a ^ - ft (1 —这 )， p ^ A(1 — a) 
n w w 


(2. 15) 


证昍 • 份 f, (t^ . a (t) 县分布來麽 （ 劣亡们县搌銮菡救时.下 

r -—J L ^ ， J U ， jT^rnm^ ， ！▼ ' —I «9 ^ 171* V •__■ 】 ■ _ • 7 p 

面的证明方法仍有效，但要将积分改为求和），易知有集合艮 

— 1 崔、估但 / -*• -\ — 〜 …〜\ ^ TT \ 工且 

VJJuici 禾人队 1 寸 — n f — \、乂 1 ， —— ，乂 " c / • j 疋 

00 

a = P l a r ^ B )=2^ Pi ^ = n ， A w > B ) 


HQ 

^0 V 





s 


ft 


n 


e n 


n 


•n 




fi (jC() dxi … dr 


n 


2 
n= 1 




n 




— T \ f 2 ( j 0 i ) dxr ^ dx n 

t ： n \]{X n ^ti} An 丁 




B 


n=l 


n 


%/ 


I I f2 (jCi)dx 1 •••dr 
E ”n <a„>b> V 


n 


= ^2 ( r # =7?， A „ ^ B ) 

n—1 

= ^P2(A r * 音 (1 _ 0 ) 

同理可证 0<A(1 — a ). 、 ‘ 证毕. 

U (9 1 F ；、4 n ^— 女立:田 h 杳田入才. 

/>^ V V w • 丄 V ， /，" 1 i 7 M- / 1^ I |J / l>| 4K^ \Z/\ -*^N • 

丄一 a a 

o 1 —— o 

A = B = ~ ~~ 匕 (2. 16) 

1 — fx a 

公式 (2.16) 的重要金义在于 ：^j * 给定的 很容 易确定 A、B 的 
值，从而得到所要的 SPRT . 在确定 A . B 时根本不需要了解总体 
的分布类型是什么，也不像普通的固定样本量检验法那样要查临 
界值表. 

对于给定的 a、 杰使用 （2. 16) 可得 A、B 的近似值 A* = t ^-, 

•- - 丄一 a 

B* = ^. 当然方案 S(A *) 的两类错误概率与 a、 卢可能不 

CC 4 

t 1 4 

同，但却有下列重要不等式. 

定理 2.3 给定 a >0，/?>0( 满足 a+#<l) ，设 


A # 







S ( A % B # )的两类错误概率分别是 a '/ r ，则恒有 


a* 



a 


m 
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cr * +< O ! +/?. 】 

证明： 从条件 a +^ Cl 知 A *< B * ，从亩理 2.2 知 i 


* - 
a ^； 


a 


B 


簧 


1 — 


Mil ■ 

sv 


< 


« 


1 一卢 


/r < a * (l —^) 


l - 


£ — (1 — a ’）< 


a 


1 — a 


于是 



收分 Tffi 水 *7T 绝士 几 BlliR4tn 但 ‘， -L o* 〆▲ 丄 o • 47C 比 

TTA^ni I ， 1 、寸>、叩 m 以乂 / 刀， J 7 ! 口 yjw ， 1 寸 u I P U I p. WL-r. 

这个定理告诉我们，采用近似公式 (2.16) 后，两类错误的概率 

T 

-V J>» H -T* JjM» 一 L- /.A. 

乙个 H 定川、咱八 ,. 

设 Z =ln 「fo ( j：i ) / fi ( j :, ) 1 •甚右 A. 40 滿足 E：e h ^ z ^= 1, 咖从 

X J U ' <L, 9 X 、 1, 9 丨 r ■ 丨， ^ ， ~ t ~ ，，，— 

h 

(2. 11) 得到 

L t = P t (A r - <A) = T ^rSx h i ^ = 1,2) 


从而 a=l—L 和 #=L 2 都可近似求出. 


.若取 4 




• 丄 —P 

- *- _ KA 

- ■ '9 

a 


K L, 


(1 一 a)ln t 


+ aln 


n 


E , 


T 


簧 


a 


a 


E . Z , 

i _ + (1 —^ ln L ^ 



1 


e 2 


T 


# 


a 


a 


t : 2 z , 


现 在问： SPRT S(A，B ) 有何优良性？ Wald 和 Wolfowicz 
(1948) 证明了下述最优 性：设 S(A，B) 的两类错误概率是 a、/3, 样 


本量是〆，贝！I对任何序贯检验法 △ 


\r 


，c /) ,只要 △ 的两类错误概 


率 a*、5* 满足 ，5* <5,就一定有 EiT ^^ KiT * (z— 1%2)，换句话 

■ ■ J ▼ , ，， * ^ _ _ - - ■ J 「 J _ r . ，， *■ , 9 ^ ►一 ，-, 'W ▼ - , , 

说， S(A，B) 的平均样本量达到最小. 


4 又 A 1 




这是现代统计学里最深刻的定理之一，严格证明相当难，读者 

»-t r 人 • 厂 o • I • -Wi 7 Tii / ， aa» d 口 

KJ 住 LOJT^tPCPJ 匕 tTJ 兀王见 ：％• 

以上讨论假设检验时，假定总体的真正分布密度（或概率函 


你 / 一、 t=l 广 , 、 —4^ r / 、 - A • tfr^ »>—t ex^ Ztt — r -=fc* —r-* JL4. / V -A— r^ts^ rjy? / — U* 

30UM Ji KX)BX J 2 VD ， 体头邴越生， irki 目 e 具止的 or 仰钳厌 V 现 

概率函数）既不县 （（ JT ), 也不县 A ( JT ), 而县 A ( JT ), 此时如何计 

• ， ― ■ - •■ 产▼- ， -^― ■ w w ， §md r ■曹 ^ ^ v 1 ， — ■ ■ 9 

算 S ( A ， B ) 的接受假设 Hr 的概率及平均样本量呢？这个问题可 

以提成下列一般形式：设：^ ，: T ,, …是独立同分布的随机变量列， 

— - ▼ —— •■ f - r - ~w , -^- -r r — 、 ▼ ~^r - w - ▲ , M ’ ^ - ■ ■ - v 


X, 的分布密度（或概率函数，下同）是 /UJ) ， 其中 060 ， 0 是已 

知集合，至少含有两个元素 _ 我们假宙不同的 0 对应不同的概率 

， 〆 -_ ▼ • —， ， ■ 一^ w —9 p ^ r ▼ p ， ， ▼ ，- • p ，，- ▼ — * ■ _ • p ▼ ■ / 嘗 | 

' > ' 


分布.研究检验问题 


H 1 id=d\^H z id=dz (2.17) 

✓ T T ‘ I I 多 tlA. ~r^ A P # _ /tit 、 t"t ^ ， I- f I _t # I • 、 JT^I v ► 訾 、 • # 饞 a I" ■""§ v A m 、、 廬纛 • / 

^1 定恃极狴的假议， h 2 是奋徉假议） • 获 1 U 使用 5 CA ， h )， 兵悖 

止法则是 

I 

I 

氣 ■ dk ^ Mm - jm 

r ， = mt { n ： ri ^ l f A n 6 ( A ， h )} 

这里 


n 


n 


A„= XI f ( jOi , d 2 )/ Y [ /( 々，沒 1 )， n^l 


d 


给定托0，乙(仍=巧（接受故）（这里心乃是与 / UJ ) 相应的概 

^ ^ v u * f # 肅 — A A _#. # . I >—t ^ • ■ m %t># . ^ m %t## . v u t ■"> • t fc _ _ A _ v t 

半），叫做恆魃的探作符往凼奴 （ UU 凼奴）. E e iT 是具止钳皮为 
/ Yt . 仍时的 f 也桂: *： 鲁 （ ASN 涵激 n 乍桂4+售 ： T F , r * P 0? 

J ^ f-f V I ^ V I I \ ▲ 恭， ux-9 PVV ^ • vu*、II ,1 J I 7 / v ^^(7^ /U • 

令 


Zi = \n^f{xi j6z)/ fixi ^1) ] ^ Z n = 2^j 4(” > 1) 

r 

1 

®H I Z_ . n^l 1-& P. 下的随 M 游动份右 h ⑺）与 0 锥兄 F.e h( ^ )Z i = 

， ，•# V 署 i ' ▼- 一 ) _ (7 i ^ ^ V/ ^ ， ^0^^ I -4 、 ▼ f f — {f ， 

1 ，则从 (2. 10) 〜 （ 2. 13) 得到下列近似 公式 : 

/* 

f>h(0) 

(1) L ( d ) = ^ hW ^ M (9) 

(2) 若那么 


E e x 


菁 


L ⑼ lnA+(l 


- L ( d))lnB 


^ E e Zi 
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(3) 若 防=0; EiZ ?< oo , 那么 

^ V ^ M 'V 作 ft ^ ■•• jf V x. ， , 、 O 

r * . LC 0) Un/ir 十 Ci — LW))Unhr 

EeT =— E ^\ 

一 it 人 八 士也 mi a 人 irI b /D 丄被八 —P- 1 

r ihjau i ^ rr 里女万叩天坐进 m 兴件 tt 并 zrxv 

(― ) 伯铒刺分布檜嵌 

% # ■ • ^ ^ • | w I w ~^ 攀 

设 A ，: r 2 ，…是独立向分布随机变量列，•^取值0或1，概率函 

新且 ， 

f ( x , p ) = p x (l — 汐 ） 1 — J (工= 0，1，0 < /> < 1) 

1 - 

、 ■ • 、 l 1 ^ ^ ^wf- • 今 # ^ ^ - 』• - v - 丨 叠 t 星 A A I. i*i 

坟假议成是/ >= au = h 夕 i </>2). 对于橙验 r 口 j 题： 


h } ^ h 2 

- N 

我们梁用楡脍法 SCA . B ). 它的偉 I 卜法咖县，.我矿 (秦 计金 OC 

▼ ， ^ 1 ♦ *• ■_ • —^ '一 一 , , , 111 ■ » r-m 9 ^ • ■ __1 ，，-<# 『 ■ ’ _ — 

函数[(/>)=/%(接受戌）与 ASN 函数 E p t \ 这里 i % ^与 

r f L 、 -Iff I-V^ AA -Usr T^ H -La 4Jtl -M 

/ 、工腹 tPJ 恢平， 定1 日攸 tpjXX / 子朋里 • 

由于 

Zi =Xi In — + (1 — x\ )ln ^ -- 

Px \ — Pi 

A — A — 


E ^ plnf ^ a - pnn ^ 


h 


E ’ 1=(1 — 0 )(^ 5 ) +p (yJ 


h 


可以证明存在 h = h { p )^0 满足 


• ! 


E〆 


■ __ i—t 

卞是 


LCp )= 


B Hp) - 1 


nh( ii) A 

D r — /i 


h (6) 


若 


E p z 1 = pin ^^ a - pnn 1 I ^-^o 

^ ■— • — 


则 


i 



EpT * 


. L (/>) lnA .+ ( l - L(/?))lnB 


婢 f 十 

Pi 


a — pnn 


1 — th 

_ A u 

1 — />1 


若 EfZeO , 则 . 

_ • 1 * I 

…. L ( p )(\ nA ) 2 + a - L ( p ))\(\ nB )\ 

- C / 画^ - o J / T, 一 i n ’ ” .— 内二 、 

. p ^ j ：) +(1 -^( ln r ^ f ) 

I • .J : 1=1 /±r /iil 一 ^ -4rH . /-\ /n r- . 广 vi/x /-\ r\ r\ r- rt-L 

p 凹定似但 WJ 丁，石 pi =u. UD, 丄 U ， a=jJ=V. UO ，； l、J 丁 

检验问题 “ sp ' epspz ， 取八=占 ， B = 则 A = ^ 9 B = 

t _ f 、丄 a u j . k / 

19 且 


u 


t* ,= inf {n：n^ s n ^ (0. 72n — 3. 94 ， 0 . 72n + 3. 94) 


抆里 


n 






X ， 


19^ - 1 
19" -- 19~" 


其中 h =h \ p)m S 




h 


h 


可算出 E 0 . 05 r* 士 159, E 0i io t * =128. 

* j 

_ b 

■ ■ ■ ■倉 ■ k 身 fr ft ik ■■為 參 磨參 •- fch. tmrnmmmmm^k h 4 . 氣 ■ A Ihk 

由此看出， spkt 的干均枰不潭:是相 当大的 ，然向叫以验址它 

士 样太昼的給路吐亜 *X 

M_» P2J AC, 'l~T ， T- .ffi. MV H -a<H. 1 二 a> 大乃 J . 


仍令 a =/?=0. 05,我们来计算一下，为了达到同样的 a 、 沒，固 
定样本量方法的样本量要多大才行.&时样本量肯定很大，可用 

n 

极限定理来估计.在 p = p \ =0* 05的条件下， s „=2 A 近似服从 

( 、 "T" 

iV (0. 05 w ， 0. 0475刀 ） ，在 /> = pi = 0. 1() 的条件下，近似服从 
N (0. 10 n ，0. 09 w ) ，找 A 和 w 满足 
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p 


0.05 


n 


s n ^ A ) = 0* 05 ^ Pq 


. /I 

0 A 0 W Sn 


A ) 士 0* 05 


显然 A 和 n 应由下式确定 


t * 


(A — 6. 05) sfn 
707047 5 

(A — 0. 10) 4n _ 

709" 


1. 65 


1. 65 


由此知 77=292, A=0. 072， A • 71 = 21 ，故 S292^21 时拒绝杜 ，和 9 2< 
21 时 接受汗 ，这时两类错误概率都是 0. 05,但样本量却是 SPRT 

— - - ， — ^ — — - ■ — ^ — ▼ ▼ p ▼ ~ » r - 9 ， _ ■ 1 v ， ■ _ ， 

的平拽太量 ( 尺 rt rt t r * H - ia r # )=144〗 的 ~ ^倍. 

「， 9 ，■擊 9 ■ hi \ Z 、 v * v V ， T ， — - - 1 n 4 p r-i - 

( - ^ 7F 本公 太檜概 

\ -^ / —^ w ■■* ir^ 

设: ^, 工 2 ，…是独立同分布随机变奎列， & 〜假设 

u 且 “/3=/D”,：=i o a ^ a \ 料工必必 ivnasff 

/^L U — Ui 丄赘心 tl/1 W2 / f /'•J J l M J ^ : 

_ * • r * 

. H\ td. = 0i \ Q = Bi 

in -fc6^it^>k C/ A D 、 ->-U>fe3r T ■/ /5\ TZ- TT^ * 

^jynjuj . 风 If 川弁 JUKUJ /X. J^eT • 




d 


111 


/(X! J U2 ) / f\^0\ %d} / _ 


其中 


j t 


/( 工，汐) 


V 一 


e 


ir 


¥ 


— 了 （工 — 沒） 


曷知 

'■.‘弋 r 


j- 




M , M __ , M 1_ 

V(72 — (7i JjC\ 


I 丄 / / i 2 / i 2 

丁 -7TV(7i — (7 2 


故 




h7 _ i h / ^ /y \ 

= exp ^K^ — Ox 


c\ r\ I 1 / n rx \ / r\ I /1 \ ~! I 

6 u~rnKUz t - c^i j 一、 c/i - r (7 2 /」 I 


可见 A 


u (^ = d ^ +d ^~ 2d ^ ^ =1 丰且 

K 、 1// Q 一 Q Hj 丄^、 ■«■ ， J AC. \j \ 2 


Fhf 


L(d) 


B h(6) - 1 


B hie) - A 


hi$) 


iLi a — n 
=1 u — (7o 


6\ +沒2 


时，利用连续性知 


345 



B hie} — I 

L(^ 0 )= lim ^ ^ 


InB 

In B — In A 


当沒专时， KZ ^ O , 故 


E e ‘ 


^ L(^)lnA + ( l - LW)lnB 

/ r\ n >k. r% t 1 r ^\9 ^\9 \ 

ku 2 - Ui ) a -\-— K(ri — tr 2 j 


I 

屯 a 土 ? n = 厂 .7?±= Va _ — ’AV 册 

^1 \J o " J 7 1 V ， 1 WZ V/1 / J HA. 


Ef 


Tfe A _ P n _ 1 0 H A*rt 

取八― 1 ^，公—~ 7 ^ ，匆巧 


Hn A \ n ^ n \ 

\ 11J: ^ X / \ ILL J-/ / 

id 2 — dl ) 2 s ^ 

、小 :•• 


E e z 


p\n 


1 r\ 

丄 一 P 


* 


- h (1 — /?)ln — 

\a ' < a 


e.y 


1 _ r\ 

1 — P 




(1 — a)ln - haln — 

_ 丄一 a _ a 

^ - ~ip : 

_L,/3 — /)、2 

rT V^2 ^ 


(2. 18) 


(2. 19) 


~TT T5?^fe/ri UK* QDDT 车 nREtb 任士县士么必吐 l、f 曰 $ 合 fr 求 Vr 甘 4vft 士 it 
I _ 只 |U 认上、丄 TH Mil 疋 1 卞于里 1 光迦仏 , k>S 业 ， JN BVI 旧 131 H ^ Tl 

本量方面的好处. . '' 

xn Xt» x T tv T-f I -rtrl 曰 / 1^ JLU ttf L2kL 1 . 曰一 -LA. tt 八 口 、丄 ■_、/• JlU — 

ntm IN - r 引埋，珉 iTCtfJ 回疋忤+星恨诞定达件的：彐工= 

— Y .^ > c 时拒绝 : d = d '， 当 时接受这里的77,（’ 

, m - »■ w -- 論 ^ t ^ 1 ■ — ■W 


应使得 


(^ > C) =a > Pe 2 ioc ^ C) 




设& 满足％ -^ e _ h 2 dr=A 


，则 


1—^ ▲ V 




(C — 6i)n = K a9 (C— 6 2 )n = Ki^ 
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• ( K .- K , 
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{ dz - e.y 

id 2 一 d\ )K { 


K a -K^ 
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1 ~a 
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， S ( A ， B ) 的两类错误的概率近似地等于《、 


S ， 令 


E e . 


§ i . 


9^ 


从 （2. 18),(2. 19) 得 
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1- 沒 


户 2 




卜 … CK a - K^y 

对干堂用的 II 个 ry、R •妾 2. 14类 2. 2列出了 100^和 1.00 /A 的倌 
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表 2. 1 100/i) 



2 100 fit 


41. 


38 


36. 


扇 

48. 


M 

4b. 


A M 

44. 


49. 


• 10 


56 


46 




46 


: U 7 


參 

























从这两张表可看出， SPRT 所需要的平均样本量比固定样本 

* 

B. B Aii 4^ 71 人上 “ JaA -J-* ㈢ 1 -OT? .1. Ar=t /=^ td -rr? -=rr -++* ， lf\ l\f- -L^ 白 - 

里的取 VL1S 题的忏平星安 / 』 M 守仗用刖百卞岣 Wj 13 苷忏平里 — 

半左右. 

* • 

■ jgmgk 隹 .^, 一 a _^a — 

例 2.5 坟 : d=0,M 2 ： d=l,a = ^=0. 01 ，取 

Q 1 1—/ ar ：" ' 、 

A = ^ = -^, b = u -=99, 这时， 

1 _ a 99 a 


Z , 





工 1 — I 





Lo 乙 1 = — 




r . 0. QQinOQ)- 1 +0. Oiln99 n 

“o r — ^ — l y 

% 1 

2 

^ * . O ^ OllnO ^ r 1 +0.99 ln 99 . n 
t，ir = - - - -:- = 9 


Vg/. tn rxJ 士 ^ -Jr- 曰 ‘ A/* B ZJi 4-As. 7T 人 >4 - mil U^» • / T ， 

石木川回疋忏平里 trj 取 l ^ u 恨题広，只 UM 取 n =、 i \ 0 . 01 _ 

K0.99) 2 ，査正态分布表知 K q . oi =2. 33, K 0 . 99 = — 2. 33,于是 n = 22 . 

t • m ^ ."^"^垂 —,.. 身 l J _ • 、 # > _ *" i i _•■ > . — t i ►■今 _ > 纛 • ■一 ， if M * • •、 t A W i V # I 

RJJAL ^ FKl 饥搿的 千均样 不重是非)予页情肜最优极验法的样不 
鲁的41吹 

M V 丄 ▲ / U • 

以上的讨论都是针对简单假设和简单备择假设进行的，这时 

6h QDt>nr 古 4 日 + 占 史 fzn 智九； Eifl* 占泣苗 r 几力任 Aft 虔毋必 

1 、丄 -r ipcyvov i/u^* j 欠本 itx 认， /i!L 不私 11 ATr 口， 

验法呢？这个问题现代有大量研究，但未能彻底解决.下面只对 

灿且尬 M AM 达 VO 人 £m AL TM 士 .\4* 

— tt 取阅平 tnri 苒视刀広. 

设 X 的分布函数县 PX ： cJ ), 分布密麼 (或 概率函数）县 fix , 

r ■ * ^ ^ 『__ ■ • ^ ^ ■ ，擊 p _ * ^ w ^ ^ ^ 、一 _ r 

沒），这里(泛，否 ） =@， 一 <^> 0 . 给定没1<沒2 ( 汉 €@， z = 

1 .21. 老鹿給骑问额. ^ 

— 7 _， 7 V 戸 W ， I 二 ^ -^LIX^ I 鏽 1 • 

Hi id ^ 6 i ^ H 2 id ^ Qi 

如何进行检验？设 a ，： t 2 ，…是 X 的观测序列，仍令 


n 

A„= 11 /U ， &)"U) 

1 

取 0< A <1< B ， 仍采用 S ( A ， B )， 即停止法则为 
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r * = ini{mn ^ lf A „ G ( A , B ) } 

ikri 斗 vnti 儿 
广 Jt ^ c 広只 uyv : 

f 拒绝凡，当 V . 

d * =s 

1 • ^ - ^讎 w A Y ▲ A 

L 接雙片， ^ A r * ^ A 

^yjkHAa^^h « 广 a »、 t d / ky^ p \ \ 

Aa^4 f \^L r^L ^Z^ ^ \-f x f jlj / ^1 1\T I 工 .70 : H J ,/S >CA \ 丄 \^ ?t/y ； ACi 

随机增的情况. 

\'/ 1 1 八 -rfrr -fcfc' r TT»/ /i\ 1 B, Xbiz 441 AM -fcH _ 丄 Tl f\ 少 〆 

At 入 ▲•厶 仰 万叩 狀 \ r 、工,(7乂 / 疋 Warner wv , 石 /vj 一 yj <7 i 、 

<9 , 有 

▼ La 9 ， 

\ <1 I 

* ^ . . ' — 、 4 *t ^ *" %. r * ， ^ l 

FCr ， 仇）參 t\x,d 2 ) C 一切 x) 


脑如 +# 的从龙拔且交曰 U >66 

rni iyb ， 曰 yj j [/g^H jh 

F(xJ)=D(l-e+), Q e (0,oo) 

甘 nb 

r 


* 

c\/ \ 

fl ， 

x ^ 0 

0 KXJ - 

No , 

x <0 

和 方差为 1 的正态分布族 



F ( x f d)-{ X 1 e 

-y(ir-(?) 2 

: . 

du ^ d ^ i _ °^V 


/ r\ 

V 乙丌 


都是随机增的. 

■ . 

•:. 叫以址明卜列里要锘论••吞 （ i % rj )} 是随机 JR 的，则探作特 

性函数 U (?> iiV 接受私>是沒的不增函数.因此有 、 

’ sup iV 拒绝氏 ）=>. (洁绝 Hi ) 

， 1 

• Slip P〆 接受^0=/^ (接受 Hi ) 

j 、- I * _、tt n L、A _ L- m Ft - 、f _ 八 J^L^ — Lt-t vt> J=^ -t-» . 

芏丁于叼忤+重，忭刀 ^ 0 V 幽驭相彐 夏尜. 

你士太书的主匡 .弗们 指屮 .SPRT S 妖亦书省 迷龙骨 lr 右很 

II /¥ l ^^4 t* ^4 7 w * ^ — t _■* ^ y\w l-J-^ I ▼ » III ■> _ 钃 I 

大优越性，但样本量并无固定的上界，这对实际工作带来不便 . .30 
年来，许多截尾型的序贯检验法（这时样本量有上界)受到广泛的 
重视，如著名的美国军用标准 781 和我国军用标准 899 就是采用 
截尾型的序贯检验法.参看 [22]. : 
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我们指出，上述 SPRT 在应用中还有一种局限性 ：“序 贯性太 

3P V -I4A -Jr- B TT-t 人 /-i* 人 人 til* rx? Tfl?t 加 || >CH A/* / 人人 /-!♦ rtfit Mtl 

m -忏平定 > vr 「 件一 " I —'「观您<人; ytwui 守到則、一 i n 砰肌汉 y 

完毕才可能开始观测下一个），不能同时进行观测.对于那些需要 

- »rrt >rt.r m K •、―» 1/ j ▲ /v 卜 A t t ^ - »rrt 、irtti 声 _ ■ il » r» ■ ■ ■ * /z_^ ✓ 1_— 、/^ ■ 羼 - • 4-4 • .►a— 

观测时问很 ■ 酣恃到 ^ 评观测俚的头，阿 : 丄忭（例卯计多医约汀 
狁试脍 kSPRT 钼难觉输拼对砬 轴楮况 .曰本屮视了名轴钰的 

n ， 7 一 — 美 ■ _ V ! ，， h^ iMia « n i 产，钂 ' i I j« ^ ai-h -^ij ， #-*-i ^ ■• •■ 'j;rj " w 

序贯检验法：成组序贯检验 （Group sequential test )、4 时间序贯检 
验 （Time sequ ^ n^ial test ) 等’ ，读者可参阅 [14 j . 〜 入 


3 序贾估计与随机逼近 


序贯估计就是用序贯方法估计參体的特性值（比如估计总体 

所含的未知参数的倌）.与序贯枪验相类似，它的重要件也县在两 

, ， ■ w w - - ▼ ■ ^ — I ■ r ▼，- ， ■ »» w w ~I w f ••量 ^ w w ▼ 

个方面.一方面，序贯估计在许多情况下比起非序贯估计来有较 
高的效率，即为了达到同样的估计精度，序贯方法所需的(平均)样 
本量要小些;另一方面，在某些情况下不存在非序贯的估计满足所 
提的要求，但有序贯估计合.乎要求.这后一方面告诉我们，序贯估 
计是不可少的. 

序贯估计包含序贯点估计与序贯区间估计.序贯估计的理论 
和方法从20 也纪 50年代以来有很大发展，研究的向题裉多，方法 

tU At -I4A hlA Mr AA .vU ^r» TUI ，人 l/PI 4fl(Sr rft 吉 / •、- 1 -4-* tt-I* 

m 夕 rr 夕汗 ，: wj 职乙巩一 trj 刀広 >tm 牲 tis 、 m^r m m i ^ rv 

\ 

贯估计作全面论连，只以正态分布均值的估计问题为例，说明某些 

—r~. ~nr 上 l -Lmr 人 -<**-» ^ - v. I - 

里安的 惝芯和力沄. 

j 

份 X 〜 /VGnM.n 2 规去铂 • Y, _ Yo Y 的轴古观涮序 

一 應 * ， \ 7 vr ， 7 7 — — 1 、•墨厶 7 • 墨 "V r i * / yw 4 ^W / ^ 

蠡 ■ # V, _ 全 W - — ‘. .1 _i 、 . 身身 > • 觚蠡 m _ _ _ * 1 % 

夕! J ，我们釆妍究 / i 的估计间 US . 


问题:给定 /> o 及 

( 叉 1 ， -" ，尤）中（叉 1 ,，-,;^)满足 


是否存在正整数„及 P 


A ^ ^ — ,* 7 

^ ^ ( p 2 ^ ^ 

( 炉 1 < # < 炉 2 )》 y ( 

* 9 _ # 


切 fl 9( j ) 


换句话说，是否存在固定宽度的置信区间（这里乃是参数 
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为时的概率）？ 

人 i、：H 01?t AM Asfr Q ~ 3 kt AA / •、- 1 IW )卞 tJD ~T* itil Ihn. .UU Ir \^ ，人 

32^/ ri w J 趙 trj 甘朱定疋 trj ，议 iu ki bKmm r wj 一取 i 土用 

定理 3.1 设 X 的分布密凌是士 / (9), 其中 " e ( — oo , 

o \ o / 

«^)，斤（0，^)都是未知参数，叉 1 ,"*，尤是叉的样本._对任何 
«及 z > o , 不存在^之长度不超过 z 的置信区间（置信水 1 平是 y ) ， 
即不存在 A ( X " … ，尤） < 92 ( X " … ，又） 使得 

cpz _ 平\ < I (3. 1) 

P ••一 （ a f y ( ~ "^31 (3.2) 

ui/ ，1 — |_ r -l '厂 “ ， ^ 0 ^ w 、 ， ▼ / — ，一， ， 

JS 

泣宙 P 县斗龙够苷时相仿的挪隶 

▲ pus >AI— >/V »r* M-l J I 1^4 "I W /-IX. MV I^TU-T - • 

a \ a f 

nrnB 瓜古一 一雄口 、i 、换介1 士匕山，1、人古-估但 

HL.m : k>C ， F3 <p\ J(p2 mMiyo. x/ ^ IIJIS tU^^R 13CW 

P^a (/i ^ [f 1 中]) < y 

实际上，令 +9?2 ) ， 则 


6 [pi 中]} C 丨 I I ^ ~2 ^} 

\ / 

取正整数 N>^, 再取 & < 忤 < … 〈 /i2N 满足 /ii+1 — i>l (i=l, 

7 . ， " / 

2,… ， 2N—1 )， 于是集合 

I 

/ / \ 

Si= | (xi ， … ， X” ） r| 占 （JTi »••• jX n ) — fJLi I < y|. 

G‘l ， 2, … ， 2iV) 两两不交.因此 

\P..A(X, •“••[) f S：) -P. -(CX, ••••D f S,) I 

I u ^ ▲, , — r*, ， t , u-t i/、' — * r f — ，丨， ^i— , 


n 


■ ■ ■ / r w^ - . m « . % 

J s ； .. J ^ l i /( ^ j d ,,.^ 



令 


Ml 

V ^ 


_ 



Xk ~ fJL \ 


a 


y k (々 = 1 ， •“ ， w) 


S* 〒 {( 》 "••• ， : y«); ( 工 i ，… 6 S { } 


则 


P (( Y , 

\ \ ▲ A ■ 




MjL ， 


xj e s ^- p ^ ax , 


Ml A 


X ) e s ,)!, 


< 








s 


簧 




TT f ( 


n 


Vb + 

-- 


k 


a / 


TT f ( v \) 

JL-L ^ 


dvi •••dv 

mrn^ " 


ft 








# # # 


R n 






«2 




TT 


■ ■ t I a 響 


k 


+ 


a ) 


r . 


fhk ) 




1% « ■ A # /H A 嘗 

UJ 1 UJ 


k 






R n 






I 苳（ : y+ a) — 发 （ y) I d：y 


^ ^ . _ 

其中 


a « 蠢# ■ a « 

y \ ^ ^ y 


n 


a 


Ml 


色 （1,1， …， 1) 


Q 


n 


✓ X 


H 1 

由于，根据 L 连续性知 a —0 时 






R n 




I g(y + a) — g(y) I d：y -► 0 




(见周民强编《实变函数》第140页，: fl ： 京大学出版社， 1985). 于是 

% ♦ I r% / / ， T" r v / / ， y ^ r v r^% v I 八 


a—^oo 


Kl 


1 O 一 O NT\ 
Jl ， 厶， ••， ，厶 』 Ny 


可见存在办>0,对一^切 i = l ，2, …， 2 JV 有 


U(x" … ，尤 ）e s^-p^ax, x n >e s t )，|< 


^1^0 


2 N 


/n ■ /-^ Jv * • 

但什仕 t 0 istM 守 


■w^ ✓ / T V V V 

〜 0 uA".“，De $ 


2 N 
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故 


/ 


P 一（（ X "…， X ”） 6 < 




N 


刖右 


p 




l<ri 


8 一 Fo ' ^ "2~ 1 ^ ]v ^ 7 


更有 


p v 。 {" £ 。 e [妁， ]}< y 


这表明 U . 2：)小成立. 


v — 謙 t ^ 

址毕. 


下面指出，对于正态分布 N ( fz ^ 2 ) ，采用 C . Steiu 提出的两阶 

%. «. n ■ ■■幽 M -■ k » m - l> - 風 m a - - • Ik * w . 

段方法叫得到 / i 的固定宽度的置信区间. 

U 由畑 9 1 66^CBB>hf 班丢山 士车 _ Tit hf 杠杳+ 选忠 田卓從 

"、 ACr /m u •丄 Wl* 7 J AA "lin ^ UL4 f M-l g 届丄 ^ /、赘 M± HAk Mil A^r 1T~ 

本量方法岀问题.如果 ( T 已知，则取 

w > ^ z ( T 2 u 2 a I a 






\ 

) 


(pi =0 C n — d , < p 2 = x n + d 

A j* _ I %. ft K. 4k ••- li. ■■_■ I Ik. ^ — m ^ ^ •蠢 ▲• Jh %. b -■> —Mh 

那么 （3. 1) 和 （3. 2) 就满足 r ， 这里仏 为 以（0，1)的 a 分位点.现 

在 CT 未知， Stein 的方法是先取一个样本来估计〃的值，然后再利 

- . t -< ；; h . 

用这个估计值确定第二个样本量的大小，具体叙述如下. 

取 171 ^ 2 ，令 = 土〉： JC , ， 

m 




m 


i ^ U —D 


2 


T 


V\ 


inf ( «：n ^ 77 z _a n ^ 


m — _u 


U. 6 ) 


其中 d 


a 


( w —1) 是 m —1 个自由度的 t 分布的 cr 分位数. 


显然 Pfja (n <C 


OO 


，区间 


X ti x ri +^t^i{m-\y 

VTi '- Vzi 


(3.4) 


々 a 

\y 





2 y 


的长度等于中 （ m — ，我们将证明 


v^rT 


e i )=7 (对一切 " a ) 


引理 3.1 对一切《>2,元与 U ， …， V 〗）是独立的，这里 




^j- J^Uk-x,) 2 (t>2) 

丄是 =1 


Xi 


» 

X 

V 




证 明:令 


V* 


u ：^= — ( jo , 

t 、—丨 

a 


n 


)(M n 

' \ 一 / 


则 a ， …，…独立同分布， a 〜 iv ( o ， i ) •令 


yi 


VW + T ) 


u\ + … + 仏 —m 糾） (z’= 1 ， 2， …， w — 1) 


y»n 


— ■ I 11. 

J — \ 

VW 



鲁 # • 


+ u n 


易知 


■ # ■ 


， v„ 独立同分布， W—Ncb.l). 耵 WiTP 昍.对一扨 » 

- * v - * ▼'了 -_， , x — — ,, ^ ，，雩 ria ■ >r ^ 




Vi 


a 


/ 2 I I 9 、 

yy\ -i - \-y^i) 


/ M# V 

, U . b ； 


八 \ , I - r j ■ 菖 ■■ 才 ^ X > I I v » t __ ^ 

争头工，回疋 y ^ — Ku ^ - hM ,)， 则从⑷，…，乂到 

Vr 


y \ 




>， m ，义的变换是正交变换，故 


: y ? f …+ ： y ,_! + y 2 i = ^ 


所以 


: yf + …+ 3^ = 2> 卜仏 > 2 =4 Cr)- 元 ) 

t ^ 1=1 
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从而 （3. 5) 成立. 由于 （ v 〗 ，…，只与： yi ，…， ％一1 有关 ，而元 = 

只与 h 有关，故叉与 ( v 〗， …，相互独立.证毕. 

s/n 

* 引理 ,3. 2设 r 只取不小于 m 的整数值，且对 一 切存 
在民满足 

{ z = n }= {(vl »***»^) ^ B n }\ " 

则有下列 结论： 


CD 元是 / i 的无偏 估计; 

/ O \ 1 / — / — \ ^Kl / f\ 1 \ 

k^j — vr 、： c r _ /ij 〜』丄 j ; 

a 「 


-i 


(3) — \fr { oc r — u ) ^ t ( m - l ). 

V m 


I 

l 


证明: d =2 E ^ d iT = n ) x n ) 

n — m 
oo 

= HP ~( r=W ) # 0C n =/i 


可见元是 / i 的无偏估计. 


P 




石 {x T — fjt) ^ Xj 



n=m \ 


.oo 


E p 


nn 


n=m 


oo 


Ep 


n= m 




I 


r = 

= n f 





擎 

r : 

= n 9 

1 

— V m 



a 

r = 

一 

1 

■ i 


^fn(x n — fi) 




^ X 




< JC 


a 


P 




a 


v m ^ y )0( x ) 


其中步 ( x ) 是 iV (0， l ) 的分布函数.令 y 


得 


(含 VT (5 " r — / jt ) ^ * r )= 步 ( x ) 


* 





故与？ u 相互独立，从而 


^{x r — ") ~ t(m — 1) 


fe 毕. 


定理 3.2 设^如 （3. 3) 所定义， J 如 （3. 4) 所定义，则 
(1) p , a (^ en =7 i -； 


(2) E^ix 


r i 


、 2 /( m — l ) c ? 2 

V //^ kj y 


(.当 m>3 对） 


其中 d 


9 t = ti±i{m—\). 


证明： 从引理 3.2 知 


P 


/ 

( 


Vti ix — fl ) 


\ 


^ ti^i (m "— l))=y 


即有 P~("d) = y. 


E. 




E. 


(x — fl ) 


\ 


T 


< d 4 E t 


T\ ix T — fl) 


d m — 1 

t 2 m - 3 


证毕. 


% - » 蠡 a 詹 W _ • 參 w —. ItoMwAk 齡 # A _^ ^ v ▲ ^ • _ 孤■禮 二 )_ ▲ 詹二 %. ■ 

足理 3. 2 告诉我们，用 Stein 万法的确口 J 以得到苋度小趙过 

給卓估 66@^ RT 间 4子木七吐的址占且择★县的+/1、尤台垃 

叫 ACr 母 W；； _a* | 口 kl^ I-J • I J4 M -J MW jTvS ACr IT X T" t 1 H V /、 ，J • , I ， nu J 丄 

制，当 a 很大时， £:~ n 可以取非常大的值.第一阶段的样本量 m 

r^4trr \U T^t /o^r AtT n/r 、朴。丄—•一 i4/t Oy4 - 曰 -Oil iJx 

⑵甘 • xhi w j ex .ee oieui trj 刀広一且疋现1^^丁夕 

学者的研究对象. 

•w • ■ - ~w r W 

户 — ■■ ^ ■ > !"■•• • ，一重 ^ T Mrt f •龜 Ik T y" 9 x ■ 羞 ■■• /■*> % 、 n T ，v r% _ 

例丄 1 匕刘屈、扑 A 服从 ix 1 = 0 . 0, y = 
0 H 雜们耵田 Stpin 而阶段古法摊屮的晋信氽軍％ QS _ 

w w w • |l -4 / li# —^ •• n yy , 1 一 ^ 14-^ *V，M *-*-* *-• V i—1. I 卜 IN’ I ^ V - • w w ^ 

度不超过 0.6 的置信 区间. 从总体中抽取样本蕈 m = 21 的样本 

f 笛一 Kft * El •样 * V 

v^r vj\ r^ rr^r / : 


0. 72 
1. 08 


1.69 0.82 0.21 —0.09 1.57 —0.26 


1.94 1:60 1.19 


1/04. 2, 74 


1.45 
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0,27 -0,84 0.82 ^ 0. 77 1. 93 . 0. 36 0. 13. 

■-U >LL^ lLi ,4^* -A- /=*? •— A n ^ -WA -A — >— … 2 r\ n n ^ /V An 

Wi ^ L 开 £ TH = p 平8但工 21 —» 丄， IT 乎刀左取 21 — ^. /0,且 I 7 T 叩衣 7 H 

io.975 (20) = 2. 086. 

取 d = 、 = 0 , 3,知 

争0。. 975 (21)) 2 = 35. 29 

t f _ W “ 

从 i：3. 3) 知总样本量 n 应取36,故第二阶段应抽取样本为> 15知 
样本.设第二阶段样本 如下： 

1. 23 2. 11 1.07 1.02 1.84 — 0. 20 0.05 1.83 

0. 46 —0.06 0. 69 2. 32 1.05 0. 44 0.30 

. m ▲ - * - . A b ih. * • ^ m __^ ^ • fc • — ■逢 

由此算出总样本时平均值石 6 =0. 92及 


V 21 




\/n 


975 


(21) = 0. 297 


从 (3. 4) 知 m 的长度不超过 0. 6的置信区间为 


[0.92 — 0.297, 0.92 + 0.297] 


nrt 

即 


[0.623,1.217] 


(置信水平为 0.95). 

•- _ . ' * 

女甘 66 ifel " P ： 敢 >4 V 且杜此66处4+1口衞 _ Ks^-kn ^ 

m I J4 Ati y w 4 vxu i ivtt^tv im v i Kss rm r v u as mm • 

随机逼近起源于 Robbins 等人 （1951) 的著名工作，由于应用广泛 

, 1 * , * S * 1 

T7^ SSL ^Vl I /. v -t AA 姿 -vm rm ri Tpi r4^ 私 Tin 处 AA 人八 士 、rV FP rt 人 

1川又到八|1』们里优，观[：7]>肌双牲巩" 0^——，「万 又. 込壬只 吧 

一匙简单而典型的情况/ 

• 9 , W - - -w ^ 'W 丨 _ 

、 rt 1 ^ A ―- A - 、 r'_ rr-t H A—* u_l? > L Li. r ^ 、 4« H 

坟 mu ：) 定一个凼奴， 一 个芾见的 W 题定水万荏” MU：)=a"0y 
坦加里 A/frd 的类彳女才县 R4n 的.皆田孰铂的 Npwtnn-NflriVi^rm 

1#^ • ，■〜 ♦ ， ▲ 、 x m v C m v 7 ■ ■< / M v ▲ ， 一 f w 

方法求解 。 在实际问题中，往往函数 M(x) 的表达式不知道，但给 


定： T 后，我们能得到某随机变量 Y 


的观测值，这里 


ElXr )= M(:c)， 这个 MU) 叫做回归函数.如何找 “M(：c)= a ”的 
根或根的近似值？这是实际工作中十分关心的问题. 




357 





例 3.2 设1表示注入小白鼠身上的被检药物的剂量 ， Y (: r ) 

: fcr 二业斗 1 AM 计 lUit CTl Jv r^-t £3 AAt CT r^f Ofr CT /V 7m ^ 

衣 / j 、 当 tt 八 x jry 里 trv 烈切 / 口 / j 、 仁 1 眼 trj ; 乂 ;！• 啊*; 乂收刀 ■肌們光，一 

类是注入后一定时间（如24小时)之内死亡，另一类是这一段时间 

—r* -rrrr -J • 丄 /^ 

fix 

(1， 如果小白鼠死 !"■： 

—.▼ / 、 | - -， W • -■ ▼ ，， - - - 

Ykx) = 

10,否则 

一《 、 d 1 " 、 / 、 — 、一一市 rL 一」.一 山此此 

丁定 tLl ^ x )= iVl ^ x ) = ^^Y ^ x ) = U 衣不 f 叼夕 匕11 半 • ，所谓午戮现 

S 

• . * 、 

1 

■冒 w 秦 t=ai ， v t \ I LL m ， / 、 丄 %% fcrrt t 廉 ■ 产 _\|/^ \ fv -=r» A - f - 、/ 1 、 上 

夕匕重 h 乃定万桎” = y "的根，这定医罕试岸甲识天心的重. 

w* 

如何求出 L ? ' 

我们回到一般情形下如何求解的问题上来.最早提出、也是 
最著名的解法是 Robbins - Monro 方法（简称 R .- M 方法） ，叙述 
如下： 

取定适当的常数列{^ , n ^ l } (通常取 a n = ^) ，先取初值:^ 

/ \ hJ}L C^l txi ~~T* TCtt、M -fcA* /V — 

i 吊似乂 ，從 w 口用 r 

= x n — a n ( Y „ — a ) (n ^ 1) 

r « r» r 曹 

* 

来确定序列 { x „ ,/ z ^ l } ，这里八 = Y ( x „) 是 Y ( x ) 在 x = x n 时的观 
测值 ( n > l ). 设 “ M ( x )= a ” 的根是 化可以 证明，在一定条件下 
P (\ imx n = d ) = l . 换句话说，只要《足够 大，； 可作为0的良好 

均、 * 

4 F?/hl 估 

MJL \YA ia . ! 

在实际问题里，有时要求回归函数 MCr ) b 最大值点扒6(的= 

* •■管 為 

maxMCr ))， 由于 MCr ) 未知，不能用通常的微分法来解，又由于不 

X 

能亩按观涮 $ll MV T ) 的袵似倌.也不能你田 h 冰的 R _ M 古法 

RU »— 1> t/VJ •.為 f-i ^ i^S 7 U>^ I I4U / m 丄 • m ， xv • 

. 

这时可使用下列 Kiefer - Wolfowicz 方法(简称 K - W 方法 ,1952). 

取定两个数列 } , { c n } <通常取 a „= 七， c n = n ~^ , «>1 j ，先 

取初值 A (常数），以后每一步做两个观测，用下列递推 公式： 

« 

W = x n + ^( y 2 „- D ( n ^ l ) 

C n 

• • 



来确定序列 {〜， ；2>1}，这里1^=八心+匕)， y 2 _i = y(^-cj 

« ^T.JL 、 —M^ ^ I * £^1 JLt* r^ttt-ACIil htf / 1 、 "m* »\ » 、 - T* ItO -JU* - ' 

定 I \ x ) i ± x n tc n ， x n ~ c n 处 trj 观侧但丄入口 J 以 lit 明，仕一疋 

条件下， P ( lim : r „=^ = l ， 即只要；2充分大，: r „ 可作为 MU ) 的最 


n 


大值点0的良好近似值. 


: 雪 = 丨 、 jv TT* 丨 V • —» I ■ T^k 1 , — 、 ▲ v. t - ~t~t T, XT T _ 、 • "V_L. H JtXm TJ* 

田工还円以有 m ? K - ivi 力法汉 k - w 力达叼间平芴仃••芏 

于保证收敛的条件及理论根据，叙述起来比较复杂，读者如有兴 
趣，可参看 [8]. 






▼_丫（甲圓■- ■■ ■了 

f** •乂 

■ ■ * **•■ 4 w* * **» ««■■ 


殊戚 W:::S:=S 够 $ 

'XXv-XvIvyX^v：* 



fs 涯 


— 


1. 设不， x 2 , …是独立同分布的随机变量列，且 


P ( 5 T , = 1、= = 1 — P ( 5 T , = D 、 ( n < r ^ f ) <CT 1 ^ 

通' '通息 i */ v * 办 、■息 i v ， ' v v ^ , 



min { n ： X n 






当存在 72 彡1， 便得； ^ = 1 
否_ 

p • ' ▼ ^ 


试证明 r 是序列 { X „, n^l} 的停止法则并计算 r 的数学期望. 

2. 甲有资本 M 元，乙有资本 N 元 （M 和 N 都是正整数），两人进行赌 
博，每一局中若甲胜，则乙给甲 一元; 若乙胜，则甲给乙一元.设每局中甲胜 
的概率是/>(0</><1). 问：如 果一局一局地 赌下去 ，甲输光的概率是多少? 
平均几局后有一方输光？ 

3. 设不，1，…是独立同分布的随机变量列，共同分布是 X^，( t 2 )(// 已 

1 

im -2 土如、4士科格必1^1瓶 

/44 9U 小 /4W. : n 疋 wi 、 U2 ,㈣ 〜狐扭 

H 0 : ct=cti^Hi \o=ai 

r 

* ^ 

步.屮. 电苗麻 來屮松 胳壮 

*M 、 LJ-4 / 4 义、 I9H —|— MJ M3L rtSL • 

4. 设 不，不 …是独立同分布的随机变量列， 兄 的分布密度为 

* ^ % 

( ^3 ^ 2 

-^—/ xe ~ T x x > 0 
v27r 

、0 x ^ 0 

其中(7>0是未知参数. 

鬢一 • 

给定0<(7。<^，试对检验问题 

、、 ^4 ▲ •一 — 一. 4 fc I—f - * " TT ~ * •旙 

. - N -* *u ^ A -■ 1 ； w 一 t/i .人 

求出序贯概率比检验法. ： 


• 359 • 
















5. 由于费用昂贵 ，在 战略导弹的精度验收工作中常常至多允许发射两 

安马描採亜.你由 — 讲曰播热曰 ±7 占且 AiAfers 占 66 拔占 

'J <iyU -X% tUd AC^ ]Wj l 4 口 <m 人土 ^BL TAi. • 口 ， |4J 、!^\ W W4、 ， '4 J 卞 W3 tVf ^T7S 

i ^ 

举标是 （ X ， Y )， 假定 X 与 Y 相互独立， X 〜 N (0， a 2 )， Y 〜 N (0, a 2 )( cr 未知）， 

■« * # i I 1 

验 iHrT 作中的掄验问撕县 

■ ^ - p I V w—r ▼ •. ■* •— ■ -■ 1 ， r 


Ho ： o = <jq H \ : o = o \ 

这里 ( ToCcn ^。 是精度的设计指标/试用类似于序贯椒率比检验的思想设计 
出一个至多发射两发导弹的检验方案. 

6. 设 ^， X 2 , …独立同分布，兄的分布密度是，（: T ) 或 / 2 (: c )( 到底是 

朗 K — 小不如谐 ）. 給宙輪 骑问额. 

wr « ■ _ /，■"■ K*4nir ， 7 -^ih / i^dU ^rx> ■ - w ~ 

. 

•w ^ v »—* J * _ • #. # - # t ^ ^ ■ fc« ■ ■ fc • «p 嘗 ▲/ s. i* '* ■ — ♦? _ • " I ■ — 蠢 ,, # t M ^ j > a i 

«1 : / AD 是具止的甘布钳皮 ㈠ h 2 : / 2 U ) 是具止的甘伟钳 皮. 


设 ( rd ) 是任一序贯检验法（其中 r 是彳:/1>1}的停止法则 d 是判 


决法则），其第一类错误的概率是 a ，第二类错误的概 率是片 
时有不等式 


试证明 a +^<\ 


^\T ^ 


(1 — a)ln zr^~ - 1" aln -- 巨 

丄 _ a a 


E\Z 


E 2 r ^ 


^\n 



1-0 


— h (1 _ j9) In — 
a_ a 

~~ ETz 


: i 士 m r _ 曰 r 
边玉山 t r 疋力 

/ iCXO ]. 


: r ) 为真正的分布密度时 r 的数学期望 (i 


〜 - I M M i ^ \ / 

1 D 2 V^i n 


坦元 . 划田太奋 1 rw a u 

， m / u v I w • ▲ \ 彳，一， 

7. 设 X 服从伯努利分布， X 取植 0 或 • 1, 且 

‘ 1 • 

P /,( X =1) = />=1 — P ^( X = 0 ) 

r ▲厂 

其中 夕未知 ,0< P <1, f %( A ) 表示参数是 夕 时事件 A 的概率•给定/6(0, 

« * 

1)， 76(0,1) 

• —• • r 

广1 、 ^^TPHH . b 茧择★县 SfefeHh \ 一占右士传‘ v 曰私 由士 / 66里 

'丄 / 〜 Wl- 7J : /、^ TT ， r* At ^tx 八 ， y AC,，n ■口 /J、I i JZL P 、/ 入 ^ -HL 

▲ l t _ - ^_. 

信区间； 


(2) 试用反证法证明仟何 if 憋教 n 及某干榉本兄 ,Xo ， ".X - 的估计 

， 丨 ，^ r 丨 ，，， * ■ _ ■ - _■ ■ ，， ■ , § ■ _ ■■ i ^ _ ■ m _ ■» 99 w 矗 , *■», ,»,▼ ，》 w ~~» ▼ _ 

量 9 = 9 ( Xy , X 2 ，…，尤）（0<^)<1)，恒 成立： 



换句话说，在固定样本量情形下，不管样本量多么大，参数 户没 有相对误差 


足够小的估计量. 
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第七章统计决策与贝叶斯统计大意 

•* 

. 1 < 



>- ‘ V m . W -、 •《 

统 tr 厌策叫趙楸年 

m 


我们已经比较详细地讨论了估计和假设检验，它们可以看成 

- 龜 - • 

* 〆 

日古 A / vA / t “狄 J 丄 y + t 搶，，从吐说杜 Jt >： 缺）丄山 mi 人 W 类厶口 ^ 

疋丈一取 tPJ 巩 H 口 C 讯叫付坏旧；巩 H t?C 氷 W d I 女承坦肌 • 

设 X 的分布函数是 F (: T ，0) J 是未知参数， (9 G 0，0 叫做参数 


仝问，么 = 、〜， … ， aj 定 a 的 忤牛 . 乂议 /i 定呆呗 头 p 不丄 r 戶屮口 j 

* A . 

能粜面饷么轴托劫廝铂成的韭吞隹会 .A nU 撒杆劫宓 「§T Hn 、 

I 磉 u ， I ， »-»v n il I -4 ，/' -raLfc. v «i — i—i 7 " 7 1 1 l*>% 1 •# w * 、 v 7 _ ， 

是定义在 0 XA 上的非负函数，它表示参数 ^ 0 时采取行动 


A ) 引起的损失， LO ， a ) 叫做损失 函数. 叫做统 
计决策问题的四个要素 " 

统计决策问题 是:如 何根据样本各的俥恰当地选取行动 a 使 


得引起的损失尽可能的小 


下面要对这句话的确切含义进行论述. 

宙以 L 1 稔炷太吞面（刖烊太 所右耵 能倌铂成的隹仝）剌杆 

• • v ~4 'ill ― l— I ' <j 、—■- ■ | | /， | | ^ 鏵 1 磅 w t r-j. -raufc. r-* v，»>► r—1 ' *^-4 1 ^ 

动空间 A 的映射 8=3(4 ，… ，上） 为决策函数，简称决策. 

定义 1. 2设 3=3(4 ，… ， A ) 是一个决策，称平均损失 


… RCd , S )= EL ^ d ( X \,- 9 X n f )') x ' 

为谷 的 风险： < ' 

自然想到要找风险最小的决策，但风险只(化幻是0的函数， 
对一切0风险最小的决策(所谓一致最优决策)难得存在.^ 


①本节是对“统计决策”作粗浅的介绍，不对有关概念给出 数学+ 精确的陈述. 
例如，不对有关的函数或映射提出“可测性”的要求. 






在估计问题中，通常取 A = 0， 损失函数 LO ， a ) 的类型很多， 


、貧 ， A 广 W / r\ ~7\\ / -At* m — .-T^ m=l IT>* I^rt \ rt-L 曰 tD -t-rr 

3 = PR5JC^PRl^|HJ/ t P'J ，取吊用叫书 

管. 心 、 ' ;/：-; ; - 

7 •. W /3 ^、 一 _ I /) 二 -:乃 t 

M/ f W./ - I \J “ 




( l ； vl ) 

r ^ 9\ 


(1. 1) 叫做平方损失， （1. 2) 叫做绝对偏差损失.在估计问题中的 
决策就是估计量，在平方损失下，一致最优决策就是均方误差最小 

的估 计量. ^ 

， 、 . r ' 

在假设检验问 Sfe 中，参数空间@=@0 u @ i ，@。与@1不 相交. 


设况是沒 60 t (i = o ， l ) ，行动空间 A = { a 0 ，七 } ，其中 a : 表示接受 

C *, 4 

Hjztoa } '损 宍函翠 的类型很多，最常见的有一 

- • i_ 4 . » 

〖 0 ， Q G & 

M L { d ^ ai )=^ ; _ 1 (f = 0， l )、 （1.3) 

I 1 n 广 iOi 

— t ^ x ^ u ^ Kyi 

备时 LW ， a ) 叫做 0-1 损失 • 

- TTste ：^ Ui 4 A 山山守 f tj 66 

、 Ap ： 书 UL| ， /VJ J fix I^J At2i 9 U4 17^；>K ^ VI 4 LU >VJ ^ ^0 MV 

否 走域 . v ' 

、 I 

/Erl 1 "W* J3J1* Ar iiU v 

m !• i 恤且术汉甘令 rr : 


零件的可能状态 A (好） ，仏 （秌） . 

W W w ▼ 眾 ▼ ▲ ' ^ ，pp r r ▼ 心 ' p — 

可能采取的行动 A (保留 ）， A ( jf 换 ）， A (修理): 

捅生涵齡 ^7. 

/ V • 



di 0 10 

Qi - 12 1 

I 


任女 Y 66 而估木 A e 1 /木 *il l*C 争 / rt * Aft 你太 Vr 瓜欠丁此 Rrf 
rr 个： wv > t ^ iay ^ ,v a vyy 7*11 印| 卞 tt o;i 0^7处 , 江 ^> cw 丄 i 卜 w j 

用手摸零件，温度正常时则记 X = l ， 发烫则记 X = 0). X 的概率 

^ 私 -xu 



01 0.3 0 . 7 

: a 

02 0 . 6 0. 4 


♦ 


^(\9 


问：应采取怎样的决策使得损失尽可能小? 

/>A» Aafr -T7r. a 人 ^=fcr 丄 "—r* 

u BBtry 伏 來田议 饵 y <r, 少 u 衣 itn r : 


X 

- 、 

8' 

82 ' 8 z 、 谷 4 

占 5 


87 

谷 8 

S 9 

0 

1 

d\ 

ai 

CL\ CL\ CLi 

< 

dz ctz d\ 

a 2 

a 2 

a 2 

dz 

<23 

“i 

a 3 

at ' 

a 3 

“3 


风脸为. 

' * : 

R ( dr 8)= EL ( d % d ( X )). ， 

^ * 

A 

▲ v / 隹 .，，p _ i v 1 jf v w ^ / 最 / 胃 v 'v I 

=L^ 9 a x ； rCd\A)=a! ； 十上 U/ ， a 2 ； i"Cd\A ；〒 a 2 ) 十 

XX 0，<23 ) P (在 ( X ) = “3 ) 

例如 . 

■* 

* 

D//i a 、 一 n\y r\ o _L_ i a \/ a n _J_ c \y r\ — n 

j\\Ui 、Qt ) 一上 i oywj 一 / , 

及（込，為 ）= 12 X 0.6 + 1 X 0.4 + 6 X0 = 7. 6 

八 A y f - A^Ar^ I—rt » 人 • Ii h i . 1 M w A 

y 个伏:朿的风 陧卯卜 


8 

Si 

8f . 

為 . 

\ 

8 〜 . 


Ss 




^ A 贏 V 

9 d) 

0 

7 

3 . 5 

3 

10 

6 . 5 

1 . 5 

8 . 5 

5 

R (❹ 2 ， 8) 

12 

f 

7.6 

9 . 6 

5.4 

1 

3 

8.4 

4.0 

6 


哪个决策好呢？有些是明显的，如表优于焱，表，爲.但^与而哪 

A •^ 髫 | — 、 、 i ■ ■■ * . t" ■ # 纛 * 蠡 • ■ ■ ^ 

T 圩呢？这励：小盱凹杳 J . ;: 

t % 綠也锥》…… T 、县贫里：？：左 its 

r^m 丄 • v n，*yv >r^» ^ 丄， 7 山 ” / t^t y I mv y ' i ， u i-l* 


一决策 & 使得 

1 ， * n / r\ cvl. \ 1^% / n «\\ / - l*-n r\ 广 >nw\ i：i , 

、 i \ v (7 ,o j ^ rs . Ko^oj K—yj a^ztsfj 

&对革少一个先严格的 不等式 成立. 

- ▼ ^ W ▼ 广 , 9 1 —"■ ■ ▼ ▼ _ ^^ ■—■Ah* ^ 

—• ■_ • 一外息 —J'f - t • #_ ^ ^，广 W _ .# # . I M ^ ^ t _ 4 mm. ■ ‘ I * i"» - A— V # ^ » » 一 

小难有出，任前凹的 WU . 丄 甲， d \， d ' 4 ， d \， ds ， d ' 7 是谷矸的，灸， 

n 县：^贫故的_而日尤左 it — 新 甚作 的也锥 

^6 y vy I ， r I M V 7 l_M H' I ’ I J M-* |/U MV 夕 T^ • 

如果一致最优决策不存在，只好去找比较“优良”的决策了. 

^ 7 W ^ ^ ^ 4 r 4* ^ ffiff 曰 ：#>4 tAfc h /4- & AA m、All M X 

旧 m \ JSiT 工 If ： PJ ii I IKITES . —疋 / J、J tKSfl 0 TF 一疋 tPJ PK WJ ，匀日， J、：CE 

择的范围，在较小的范围内找最优的，你 1 如在估计问题中要求 S 县 

- - , ，■冒 ■ - ■ ，— ■ ^ _習 ^ ^ ^ ， ■ - ，■ — 了，， ▼, 1 ^ 

无偏的估计，在所有无偏估计中找最优的.另一是放宽比较的要 



求，不要求风险函数对一切 <9都最小. 

，、身 , 邐 Aef\* fv m. • ' • 、 t - Aefk* M ■ —■ j. Itt» 、重 - Ae^sr «v . I 、 ^ - 

疋乂 i. 4 孙伏 m d 走 mmimax 伏朿，右对一切伏束成！ 

sup^Rdf )^ supR ( djd ) 

n /I 

V U 

minimax 决策是一种保守的决策.不难看出，在例 1.1 中么 

— _ _ — <r- - - — ， ， ▼ - ^ 'w — ■ — p ■▼- T ■ - v — • 

是 minimax 决策. 

当棘.弇许劣情开4下仿尽暑硪龟荽用保详的冰笛_ 为吐 .偷对 

■ ■ -» ,，” , • , | ,_■«#, ^ P ，、 'if. ' ^ k / K_, 4 ^ ^ W , ， ' ,， ★ 

参数彡有所了解，知道哪些0值岀现机会较多，哪些0值出现机会 
较少.换句话说，应将0看成一个随机变量，它有确定的概率分 
布. 在这种情形下，风险 R ⑽、失〒 Q 的分布的平均值〆幻= 
幻是评价决策 S 的优良性指标，数值越小越好.把未知参数 
沒看成是随机变量，这是一种重要的观点，对统计学有重大影响， 
下面要作进一步介绍. 


§2什么是贝叶斯统计 


• t M ■ >- - • "W - jgmmm 泰 _ 息 _ ■ 赢 ■■• ▲ ^K. , ^ ^ 

公兀年 ，災 旰斯 CT . Bayes ，170 Z —17 W ， 央因长老会的 

牧师）的著作《论有关机遇问题的求解》发表了。这篇著作提出了 
一 种归纳推理的理论。这个理论以后被一些学者发展为一种系统 

66 始斗女立 t 路斗 tmro^ 甘 e 七吐 並 m ： r 士 **1 七吐此姑 4+ 嫌味 1 ； ee 
in^^p\ yj ia ，仍 、 yv ” I • ^rnj^rryj ia rt-^Lyt /^i 

得的全部结果，构成贝叶斯统计的内容.认为贝叶斯方法是唯一 

人 -rm AAi ：>丄协 hkH .vt- AA )丄 ^ j=fa^ M <r4^ ^_L 山 AA m rt_L -HU ^ 

百理 PPJ 沉 H 低职刀広 tPJ 巩 > T 子有，坦肌沉下.【子 T 阳火 w l 开 I 子 

这个学派始自20卅纪30年代，到50、60年代引起人们广泛的注 

▼ 9 ^ -W ^ ^ - W W ■ W - • p t '^a ^ *■ r ▼ V 9 I F ^ r 嘗 F * ， f ▼ ’■ - 

-Ar* I. - ■— A l—» ■ ― t ■—• 、夕 . _L*i* I 

葸. 叮芏亏 M ，兵尠 M | oj 书 《 通罗入乙货 • 


份焓汰 Y 右斗东你庶 （甙搌 銮涵教 r) 由/9县去知 

r I •‘ I 、• 「 «^m ^5^>* I 7 U I ■ t ■ j ^ yr ^ x j 7 vr ,,，、 ■ ^ / ,■▼/，■】 

* 

的，但知 e 的变化范围是 0, 经典方法把参数 e 看作是客观常数， 

* ¥ 

4 S-hf 7 rfi^^r Y = rv . ... Y 、始 /» 給 m / 士 4+ 估诉去地膝 /? 

JiL^J^/^'4 ^ \ 义 : kl, ^ jL^ n / M-V H/| JU ^'4 v UL4 IM ^ I |±i ^?Ai ^1=1 J|^ *VI ^ 

属于某个绐定的范围.贝叶斯学派的根本观点，是认为在关于沒 
的任何统计推断问题中，除了使用样本各提供的信息外，还必须 









对沒规定一个先验分布，它是进行推断时不可缺少的要素.说得 

TTS" aa -rAt. »LU 44tt f\ >4^ ITWEr / _il_* "7^ HIO 、- V h -t^ ri-X 4m n OZT ^ 

无明側兰， Mjt: a j 败调込〜 m , 书口、 j 汇 （/ 与肌 


歹），它服从某个概率分布（叫做先验分布），总体 x 的分布实际上 
是沒给定时 X 的条件分布.贞叶斯学派把先验分布看成是在抽样 

r 2 

/ rtf»t MA \ -^4^ 士 il AA r\ AA /f- TlA. / 士 lit AA 4lg -^r 、- lx itA. 八 -/r* : rT 

v 现肌側 >» 昍肌书 try 大丁卩 trj 兀迴 ii 自尼、 trj 慨平衣边》兀 — 刀 ; 叩 hi 恥 

有客观的依据，也可以部分地或是全部地基于主观債念.根据 X 

L 1 • 

上 / 1 J. ■> I 孑 鏨 ， / _ Jjia* y-e — 上 x ^ y 八 x -T*r r\ H - t»A / X J. A 1 丨 - ， _ *t - T* A Lftir* 

的贫伟钳皮（驮怫半凼奴） /、 u ：， e /) 双 p 的宂狸龙伟钳皮 k 戢尤遯 m 

? • 

銮砀銳 OAMk ' sm 笪 m 靠迸太 x = cx , . — . y ) = r = r ^ ^ ) 

f 恭 署 I \ V ， 7 ^ ， JT I • •■■ ‘ ■▲ III 、論*丄 7 7 •县 7 |， 1 7 7 Jf ^ 


詹 參 穿氣 ■ ^ # ▲ ■ • f 身 •—九 ■■■— •，息 ，,_ ， 鼸 ％- • — ■ 雪 .-. —*!fci.. ijfc # # ■it / ▲ I 、 t 蠢 «. % A 

的余忏卜 4 的杂忏为;布密度 （▼汆 忏 槪率、 _ 奴）果).囚为这个 

且女油样^沛 — ■、今 b 俱 iii 的* fr 銳士曰 路公龙 m d +那 举 

^ J ㈣ ■丁 V ^ 5 Al /vu VSJ / ITT ^4 HV 7 ]'J ， /f-f ^ 2 L 1 VT^I ~^f~ 

• • f V ， - . '' ■ •>'»-、！ - 


派认为，这个分布综合了样本 X 及先验分布密度（或概率函数) 

' e f * : : ^ . … ， - , 

6( 们所提供的信息.抽样(璋;观测）的全部目的就在于完成由先離 
分布到后验分布的转换.贝>斯方法的关键在于所作出的任何推 


断都只须根据后验分布 6( 少 k ) ，而不再涉及样本 x 的分布.但在 


如何使用: r ) 上还有较大的灵活性，涉及到行动空间和损失函 

V , w ， j ■ m ^ W — r ^ ■- w 言 ■ -■ — - - ■— — w ^— —■ 1 w ^ — w v ^ 


数的类型. 


沿用§ 1中的记号，用 A 表示行动空间，用 LO，a) 表示损失 

_ I 

函数.若参数0的先验分布是$，决策是5=〆^，…， A)， 则平均 

^ \ . ( 

风险为〆幻=£#(化幻，这里尺 (U) 是风险 ，^是 关于0的概率 
分布 e 取平均值. 

定义11称 y = 8 ^ (:^，…，: rd 是贝叶斯决策，若 

■ • . ' 

* i • u I 編 ^ ^ —- «. 

it 匕日寸 p \ u ^ / m yl Ml 1^• 

要注意的痦，贝叶斯决 m 依赖于先验分布.先验分布变了，贝 


rt_L -fcH^ v^t istSL ^xrL lU TFFr TiSe 

M i 册 tK 來一取 m 女艾 • 

例 2.1 在例 1. 1 中，若 0 的先验分布（概率函数）是$(久）= 


八 /■? y j\ 、， _ ak r\ trt»l 

u . (( h ) 刊 • 则 

n (^)= 0 . 7 XRCB , A )+ 0 . 3 X 尺 （汰，幻 

厂 、一， - ' ▼ JL ， ▼ ， ~ 、▼“， 一， 

各个决策的 〆 幻值 如下： 



p(8) 


3 . 6 5 . 13 12 . 48 3 . 72 7， 20 5 * 45 


, 3 . 57 / 7 . 15 5.3 


从上表可看出 




办味 / — 八、 Mt -cm / ^ 

汉災、 a— w ，肌膠柱、 a >3 


驀 

) 




"正常 (X=l)， 就保留 u) 

是贝叶斯决策 • 

/ 若先验分布改为 )=0： 9, 6(^2)=0. 1，则贝叶斯决策是次'. 

贝叶斯统计的基本任务就是针对先验分布$(心，找出贝叶斯 

* « 

^ ^ A » 

决策. 

’ 怎样寻找贞叶斯挺策呢？例 2.1 所处 k 的是很简单的情形， 

穷_所有的决策，加以礼较后找甾贝叶斯决策.一也情形下不能 

，:、 • * 

/ i w 

4^A ILL. -acr TW? tU tt 人八 / r\ \ ' • y 、口 44A -X- / XT 

込忏1唭， IIU 安們用历姐： ZT 叩 • 议亡、? |工1， •• •，工 n >» 定忏平，…， 

又 )=(心，…，^)下0的条件分布密度(后验分布①).令' 


/ 

■ 

^(Xi f …， x „) = inf L ( d 9 a)^\x 

aeAj e 


^ x n )dd (2. 1) 


这个 pixi , 
损失. 


乃是样本值为^ ，…， ^时的最小后验平均 


若决策= 〆(&，…，^)满足 


J 9 


W 


，汐 






p\^i 


(9 9 ^ 


(对一七71 


_ Jb _ ik 一一 I _ • . ▲ 身 ^ M M W m M rn ki •• 毚 ▲秦 ^ A W Jhii i ■ 1 A 1 - . -A. ft %k • ▲ k. t A W %h V * # ^ 

则 F 就是 W 叶斯決策.这个结论的数学证明用到较深的数字知 

■ 

■ 

4 口 a t^L j 生企 ztci-TBfcim 进 p'9 9 、 66 公 *ovv 斗 tmn+kik^eF 

V 、 $ /^\ . V\ ^ M 丄 I w\£i^ lla im AC, v U / \A'4 u Atl 人 ” I 771 i 八爪 • 


(2. 2) 的意义 是:采 用决策 f 引起的后验平均损失达到最小值. 

/O O 、白 g 4^X m rt_L >U Afc AA 廿 -Or- 1 1 1 似上 止 ， LI/ -M* ^ 戒 4 山 

、厶 • 厶 y 疋寸巧火卩 I 册伏來 trj 签平 y^j aum 兀而女小 m 

、 « 

后验分布. _ 

• - ~ ▼ ■ ^ • 

怎样计算后验分布呢？可以证明，当0的先验分布密度是 

* ■ %m 

\ 

时.女 X =(^ .… . T 、 的怎 杜下 0的曰胳斗布瘀麻县 

、、 v ， — 碡 7 w JL 7 7 7 |， l-i VII I V i-f ^ /I—i i-i-i — 


①当 0 是离散型随机变量时，可进行类似的讨论，下面公式里的积分要改为求和. 
Q/J ^ • 

KJ 




芒(沒 1：^ ，… ^ x n ) 






n 


(2.3) 




e 


J [ f ( x i 9 d)^dd 


当0={久，达， •••} 时， （2,3) 宴用下式代# 


n 


彡(沒 Ih ，…，: C„) 






n 


(2.4) 


2 n /( 


这时 （2. 4) 是彡的后验概率函数. 

( 2 . 3) 的产格坪明涉友到零辦率事件发朱下如何计算条件概 
率的问题，要用测度论才能处理①，当 X 及0是禽散型随机变量时， 


① 虽然本讲义不给出 （ 2. 3) 的严格证明，但我们可给出下列有道理的说明 

P(6 ^ 6 | x, — e ^ X, ^ X,- H-e♦ f = 1 ， 2,… ，打） 

_ P(9 ^ b,jc t —t^Xj ^ Xj + e 9 i = 1 ， 2,… ， n) 

PiXi — ^ Xi ^ Xf + €, i = l，2r..，《) 

n 

但沒, A ，…， x : 的联合分布密度是$(们 IT fUi ， e 魏 

i = \ 

7\ ) w I j / . v . 2-^ *i •' * -i 、 4 ' ' 

rvcr ^ o lx , 7 a,* ^ x,- 卞 e,i 其 j ■ ，乙， … »n; 、-* 


,1 

*6 

*x^+c 

(25) n J 

< 

, x l _c 

1 


J \ 

*Xj +e 

(2e)”J 

e. 

A 




n 


x 


$(夕） JJ /( M t 、， d ) d ^ dui 」 du „ 1 


， J: n +£ 

^ n ,4_ e 


n 


f (汐） JJ/(w, ^ Q ) ddAu \ 


•: 士田疒心刃、一 iOk 伞 /) 、且汝妙 浴新口 rf 生 n 

jka±±i \ — v-/. 二 n / \u.ti// /t 丄 jcc=ix ce*xa.m'j ♦ 々《 

limP(5 ^ 61 j :, — € ^ X, ^ x* 


e ， i = 1 ， 


# • • 


， n ) 


r—►O 

* 

rfr 
e 


n 


$( d ) J [ fU ^ d)dd 


re 


9 


n 


$(d)[[f(x i9 d)dd 




从直观上看，上式右边应该就是 PW < b\Xi = Xl ，…， X„ =x„). 由于 6 的任意性，知 
沒的后验分布密度是 \, . 


n 




n 


O t 
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♦ 


(2. 4) 的证明是不 难的. 寒际上这时芒冰）=尸(歹 = $)，/U 4) = 

4 \ 


fK X—Xi 1 0 = ^；〉，于是 



= x x 



， X n 



P(yd =r dj f X { = X \ f mm * J X n — Xn ) 

P(Xi = ，…， = x n ) 


> 

% 


/ r\ n X 1 I ^ T 1 a% r\ X 

广 … = % J 丄丄 = X t \V ( p tffj » ^ 

__ i _ 

* "y]P(S = fXi =Xi / ••• iX n === Xn) 


v 




声 、 I I r/ _ n \ 

^V(7 ； V 丄丄 J KJUi ^UjJ 


n 


XX /( 工， 9 0 j ^^ id }) 


厂 


这就证明了 （2. 4). (2. 4) 就 di 初等概率论中的贝叶斯公式. 

M ， 1 v no if /i^t-te 曰 1 an 

i7'j ▲ 叹 ^jipc/ yvia>ru7Tw ，穿拟年 p ， 即 

P ( X = l )= p=l — P ( X =0) 9 0 </><l 

’ * 、 • 

、n rL^ wA /\ -ju^ 氣 ca /，v , 、 t 上 l t /x I t /八 , 、 ju m f • !■、■， , _■i _ 

议 P 的尤狴 甘仲 ^走 au , i ) 上的 甘伟.从 di ) 沖仕忤今 

..... Y =^r T ： * 的臼龄斗右你麽县 

-* 1 一 \ 1 7 ^ *n *^n I ^ M V /I—I 1 I^ UM 



p 


? x *. a - py^ Xi 




0 


p 


n 

2>: 


n 


• ( 1 — p ) 


dp 



n 
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这县叁数为 



X 


~h 1 ， w 斗 ■ 1 — ^ ^ Xi 6^1 B 分布 

& 丨， j - - f - 


设行动空间灵=(0，1)，损失函数是（1. 1)( 平方损失），则 


(2. 2) 式化为 




0 


(p — S * ( joi ，…，工”）） 2 夸(户 |工1 ，…， x „) d /> 
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inf 


€ ( 0 ， 1 /w 


A 


ip — a) 2 ^(p \xi , f x n )dp 


( 2 . 6 ) 


从 (2. 6) 式出发可以证明 (a ，…，〜）恰好是后'验分希 $( 夕 | 

* r-. ! - • 

T, . ... 1的检估制田以如 

^ L <y 7 ^ iJUL* m 'j./. ig v — ♦ ^ / />m 


d * ( <c 


i ^ 




■ 气 

t 4\ \ nr ^ 

乂 : 1 ， 


I 

'^r ^ 4h '. 


n 


n + 2 V 


( 2"* + 1 


1 去油曰 ^ m n_L#l ： i40 丄 

込肌疋 p trj 火 H l 开 I I 口 H ' 

例 2.3 设随机变量 X 的密度函数是 /( xj ) ,^60,0=00 U 

w 

jsr\ jr\ JT\ -l-tl -Ar r\ JC.A /V *iA-^br r±C 6 ▲ / ✓»、 -Mw.TtlV fcrt 91E* B 

cvi ， c?i 与 c^o 小 tb{)c ， C7 try yc 越 ; 77*t 、 (7 夕， is 避 irjss 疋： 

、rt a ( \ / 士 JL^ Tf>_ isn. 、 ri_ x w • 广 》 i 、 t , h 丄 ia ― l- 

^/ i = ta 0 , a 1 Ha l 衣不伎叉假议 ， i = u , 丄人右 A By 忤牛 

(X, .… .D 取倌 （ _r, •… 丄、』 的后验分布密麻为 AM 11 .…. 

' A, ， ，■墨 N ■ ' x , ， /I, rr ， f — 1 ， T ■_ ^ ^ -▲/ ， 


x w ) ，又 L 0?， a ) 是 0-1 损宍(见 (1.3>) •则 






e 


L (汐， <2 i ) 芝(沒 I J：i ，… 9 X n )dd 


P(d ^ ® i \ X x =xi ,••• , X „= j :„) 




= 1 — P( f) ^ I X1 = Ti 

— • \ v i j ■ — i 層 ，^ i 

从 (2. 2) 知贝叶^决策为 



r z =o * 1 ^ 

« 


( a 0 9 当 P(d 600 |Xi = J ：1 ，―, X = j： n )>y 

谷 * (JCl ，…， ：”）=| 

l a 1? 否则 L 

4A m n_L-Iftt TtA. B 、 I/ O /rt 、 l >? 々 IfU 4asT xtr 

伏口 仇，火吓所饱现疋；曰凡仪彐眾 rr 愼芊 

P(d ^00 | Xi = xi ，…， X „= x ”） 

1 i , 

不小于 j 时接受假设 H 。. 

I 

t ■ _ J^rt i L ^» . A ^tf- A ■■噢 131 * y M. . 人 / t - \ I tn~l 、口 C.A. -r* A ― - 詹 - 、 » V ft 卜 tl"! * ^ 

对卞一舣的厌 朿叫题 c 包百怙 rr 、 假议恆軀任円），円以址:明在 
坧坐广 好的怎你下 . m 朴浙乐笛县友女的.後若可余碧「81 

r I H -1 / 1^— V I I I 7 ，、， I m ， 1、I 4 卜 "鑌 7 *>% ^ h-l -# jS^ r u v —I • 

作为本节的末尾，我们还要简略地介绍贝叶斯序贯统计决策. 
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设 X 有分布密度（或概率函数 )/( x ， 们， 0 取值属于0，有先验 

/V -fc 1 裊 / n\ A 曰 fVrr t / r\ \ B 4-Pt At - 2rL Tt-U V 、 4#* 、 : C? v>U 

ttw ^ koj ， / 1 疋 1 了切 2 im ^ jzei j 逆 <a 

观测 ，得 足 ， X 2 ，…，单次观测的费用是 C >0. 
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* t - 

m nrt^ 、 r 、 r 奮 _ t %, t. fr-t.t -r^ ^ I m •會 氣 # m - It t trt»l 

厅页珧 rr 厌朿田悖止法则 r 次刊厌沄则 d ' 组取^悖止沄则 r 
吿抵弗们 / STB 计德 士挪棚 kr 县太 你齙 不抱本的随机亦畺 r m 笛六 

»—I v I II j r w j I -4 u - l/nj t *. ysi* - I - ik 、-4 t i "g mv i aix t/ u _±±i 、 ，iy ， ^ 

章）；判决法则 S 告诉我们，如何根据序贯样本兄，…，尤选取行 

V ... V \ r S> 6h/^ m zn A \ 

u \^\ i ，… j -^ r / vu 口 v 迟/两 j ^ j . 

序贯统计决策 （ r ，5) 的总风险为 


/ «v\ _ P T^r T / J\ cv/ 'XT "VT 、、 j y^~l 

、 ’ p 人 r、，ov =i^iap ， ova"•••., A r ;;-rr^j, 

(捅尖和费用之和的平; Bl 倌）.妓里 E ^ tkB 夕生腧分布为 P 及给 

， 〆 " ▼ . - — 1 , 9^ T W - • 『 ▼ ▼ B ▼ nil 圈麵 w ^ w ▼ ^ §^k ■ ■ ^ ▼ _ » _ * 〆 "■ ^ ^ W ― • 

定沒时诸 X , 的分布密度(或概率函数)为 / Cr ,0) 时计算期望. 

， 帝 W ，， K -， 》*、且口04*»；皮贵1^锥.戈 

— ■•顧 'KJ> \ L J u / ^1 79\ ； J 火 1/V>T^ 呼 >F5 . 

piz*yd* ) = inf p(zjd) 

' (r,« ' 

设沒的先验分布密度是|(<9)^1=^1，… ，又 = Jr „ 下沒的后验 

yCV^fcafeF&F^ 芒广 /3l 〜 ••• 〜、 T7 

J4 tH 04 Vi/ 1^ 1 9 /• ^ 


{r=n} = {(X 19 - 9 X n )eBJ 

可以证明 

(r • , _ ) 

^ [ l (0 9 s \ j：i ，…， x „)) +^ wC ] e(^ki ，…， ： c„)d 〜 

b w U e > 


/ 〜、 V 1 

P ^ Tj 6 )= 2 u 


mJ 


fnOci ，…， x ”） cb：i ，…， dx ” 


(2.7) 


汶里 LCi .•••• l ) 县兄 ••••• L 的联会來麽 • 

^ ^ ft 、 - JL r , - ", - X , , - ft ^ ^ ^ , 


fn (^ l ，…、，工 n ) 




n 


A 


丄 1 / VJi ， C ^ WCW 7 


e=i 


若占 # 是这样的：对一切 a 6 A 及有 


LdaWOlxv jx n )dd 

e 


> 


L ($ jd * (joi 



…，: r ft )) •芒 (01 工1 ，… 9 J 0 n ) d 6 


R 70 • 


(一切 七工1 ， …， A ) , 4 


( 2 . 8 ) 



从 (2. 7) 不难看出 


/ C\\ / CV * \ 

pKTjOJ^pKTfO ) 

为了使总风险达到最小，只须找侉止法则 ，使得 

/ * <v * \ * C / fv * \ 

pKT ^0 J = mipKTj 6 J 

r 

2 士部 /U 7 县你值丄 rvn^fff : cm 你口古士含沾 总/^ 值丄细 

ruMKi j I 口:；取 via rr 丄 l ihj 料 • 桃 _ 、 u ，日寸 - e 口 : ；取 :i/L» rT 丄 l 枝 

论，读者可参阅 [8]. 

* 

Atl 1 a 2fL JT\ _, n n 1 A _ ( . 1 v AA iVrr ( -i n o 1 it 

Uf_j 厶 •螬 R.C7—\f7i 1(72 / \ai ， a 2 /trj 取但 2| 叼力 \ 丄，乙 , 0/ ,^\ 

的概率函数 / Xx ， 仍是这样的 

— • F - W ^ ~— w w ▼ 


ffl 



0 



dz 


Q 


(0<a<l) 



设沒的先验分布为 


P(d=di ) =^=l — P(d=d 2 ) 



捅失函数 LO , a ) 县汶样的 



( 6 > 0 ) 


又设单次观测的费用是 C >0. 我们指出，存在序贯统计决策比固 

也秘 县沾 Wr 雄去 T 
化 什干里口 y 沉 氷文叮 • 

首先求出后验分布.不难看出， 

n / XT V __ \ 

rK ^\\ = J ：1 ^ J^\ n =jc n j 

n n 

，沒 l ) + (i —芒) TT / te ， 沒 2 ) 

-A- -A- -A- 

t = 1 t = 1 

可见，若 A ， …， x „ 中既含有1，又含有2,则上述概率为 0. 以下不 
妨设为 A ，…， : c „ 中不同时含有1和 2. 经计算知 


• R71 





I X \ ，…， : r n ) = P(d = d \ Xi = X \ ，…， X n = x n ) 

1，当: Ci ，•••，:《:„ 中含有 1 
0，当，…， : r „ 中含有 2 


V 


当 


工 1 


工 n = 3 


^(^2 I ^1 ，…，工”） = 1—令(汐 1 丨 工1 ，…， X n ) 


易知，最小后验平均损失 


d 


2 


，…，工 ”）= min y ^ L (汉 , a)^(^ e l ^ i ，'“，工 n ) 


a 


令 




6 min (芒(汍 | a ，…，工”），芒(沒 2 | 工 1 ，…，工 „)) 


d„ (xi , 


= p ， 

当 

= x 2 = m ^= Jo n = 3 

L 

iu , 

tTltV 

m 

• 


••，工„)= 

卜， 

当：^，…，: T „ 中含有 .1 

U 2 ， 

否则 


(2.9) 


易知 ， K ( A ，…，:^)的后验平均损失正好 是 〆 : ^，…，: r „). 由此可 

t 

« 

#■ ^ 1 t fc-k,- # # _ t \P i - fl=t ^ j , MmM m t 一《 .•一 •., ► ♦ M A V If—* 

兇，对仕例回疋的怦不重72，災旰斯厌束是此时的思风险 （孭 

失与观测费用之和的平均值)为 


pin) =Ep(Xi 9 ••• ， X„)+wC 

_ i -\r o \ I 

= oi；r k ^ i = ••- = A n = ^;-rnu 


= b^a n + nC 

自然问: w 取何值时 ， 〆 《) 最小? 

fcX. 


易知 功 ct : + Cjt 在 


§b 

C 


1 

> ― — 

秦-座 I — _ 

a * in a 


时达最 小值: 

372 ^ 



( 2 . 10 ) 





1XX u I ' t v < 

(这里假定〆是整数). 

以上讨论表明，所有固定样本 .暈的 贝叶斯决策、中取样本量为 
n * 最好. 

令 ， 


» N = ir\i( n . X \ 

这 N 是一个停止法则.用 r 表示这样的判决法则，对一切：^ ，… ， 
x n jS * (xi ，…， *2^) (!r! ，… ，Xjj) (占：的定义见 (2. 9).). 

我们指出，序贯统计决策 (N,f) 的总风险小于 p ( n *). 

实际上，此財 

( N = n ) = {Xi = 3, .X__i = 3 .X_^3y 

\— 了 _ / \ — — 1 一 , , rt x 一 , — — M, 一 / 

— {(Xi j ••• jX n ) } 


其中 


JB W = {(3 ， … ， 3 ， 1) ， （ 3 ， …， 3 ， 2) } 

、 j v j 

V Y 

n —1+ rt —1 个 

il /o n\hn 
/ yvv ^. I /7 ^i , 

p(N ， d*)=CEN 

oo 

=C Y^nPCN = n) 

n= 1 


= Cy%m=3, … ， Xh =3,X„'^ 3) 

n^l 4 


= Cl \ ^ W/V 71-1 ( 1 — /V 、 

— ■ / J • x / 

n= 1 


C 



另 一 方面，从 (2. 10) 知 


〆 《*)> 



( l +| lna |)> T ^ 


故 









p ( N ^ Xp ( n ^ 

2 去主口 口 r 公 * 、 Aft M rjt 必 ， 1 、 工 /t 如 m<±r 视士县 士冲 w ivt 
x^^Km j\iy ju 7 ftjvEWa 、 阻 ,j、j hi w j isr/ti 什千里 力広 口、 J43 、 /^ 、 阻 • 

o o 於人 / V ■ 成 • Tftl # * ^ 

8 。兀驱 : zr>rp trjiw 疋 


如何确定先验分布，这是贝叶斯统计中最困难，也是使用贝叶 

浙古法必领魅也伯▽晶 m 引茈 龟议的问丽汝+问 丽挪件 右相玄 

■ / 令 *4--% ，/、 /Ml IX 、夕 V V I J M V I 4 I I W I 、 口 IP 、 

研究成果，但还没有圆满的理论与普遍有效的方法（参看 s . Kotz 
与吴喜之合著的《现代贝叶斯统计学》 ，中国 统计出版社，2000及 
J . O . Berger 著的《统计决策论及贝叶斯分 析〉〉 (贾乃光译），中国统 


计出版社， 1998). 从实用角度出发，应充分利甩专家的经验或者 
对历史上积累的数据进行分析和拟合，以确定先验分布.在确定 


先验分布时，许多人利用下列的协调性假说. 


协调性 假说: 若总体 X 的分布密度（或概率函数）是 /( x ， 仍， 


则没的先验分布与由 / E 和 X 的样本确定的后验分布应属于同一 


类型.这时先验分布叫做是与 / Crj ) 共轭的分布. 

^ ■ & S ^ Hk 氣 I 義 藏 •< Jhk b Jb. a^. Ak 墓 ^ A. —. a Jfak. ^ k _k 歲 

这里未对“同一类型”四字给出精确的定义，也很难给出恰当 
的定义.通常的理解是，将概率性质相似的所有分布算作同一类 
型.例如，所有正态分布构成 一类; 所有 r 分布构成 一类； 所有/? 
分布构成 一 类. 


这个假说指示我们，先验分布应取何种类型，然后再利用历史 

« U=I - rl ^ JX - tt 人八 JL “ -U iVtr /V 、/^ rtli - 1 ^ "D 、丄人 / m 1=1 

败惦木俩疋尤 题冗仲 M " 1 tiy 木 %i pp or • vt ^ 头既衣明，込/|、假说定 

符会窀阮的. 

R ， r—f 〆 、 ，- _ ， ^ ▼ 


• 、 • ■ 鑫 ，、一 ■■产 _* . 灰 •■ 處 .%!>. »— » # » • % M ^ t 氣 •氣 I 1* t_i^ * -- ,, 麝丨 1 —* A ,1 ， • 

以卜获 II j 安对一些芾见的分布找出具共轭的无遯 分布. 


宙捆3 1 Y , ..... Y 县伞白伯您刹从亦广余浙县 

/ m — ，工 v •在 ▲▲丄 7 j /■、 i—I im 々 n • r 、 is =^ -?w 广 7 ▽ 、 

夕<1)的样本.若 f 的先验分布是/?分布，参数是 a ， A 则在兄= 

个 V = 个 "TT ^ 66 _ U .. O-U ^ — .. 6(i o /X 

乂 1 ， ，八 n 1 ， n;w 口 ^: 力 ih u 1 J，p 1 j urj fj 力 


布，这里 Zj ^ 



证明，…， A 的联合概率函数为 


/>? x, • (1 — py ? x, 

, 2 -j Xi , 

i 

p 的先验分布密度 

▲ — •- - - ^ - r *■ — ^ — 

e ( p )= c ( a ^) p a ~ 1 a - py~ l 

n 女苗 C ( ry . R )^^ m ). U 公式 （2.3) 知6的后賒分布密摩为 

\ ▲ V - J ▲ — ' 鼉 ~ : 1 ■， x ， ，， ' ‘ ■， ^ — ， 一 ' / 1， £； ^ / p—f ， ■• ，， ■ I - 一晶 f / ▼ 





/„( Xl ，…，工 n ; P ) 尽 （ P ) 



= Ap ^ P~ l • (1-/> 广 * x ， _1 

这里 A 是与 6 无关的数，可见后验分布是参数为 a + y ^+ n-y 

— — -- r — — — ^ ■—- - _ — ， — — w r — — 穿 - » 

的/?分布. ， 证毕. 

定理 3. 1告诉我们，/?分布族是伯努利分布族的共轭分布族. 
定理 3. 2设兄，…， X „ 是来自 Poisson 分布的样本. Pois - 

son 分布的参数是 A ， A 的先验分布是 r 分布（参数是 a ，/3)， 则在 

n 

不=4，… ，又 =〜下 A 的后验分布是参数为 a + U ;，^ f ；2 的 r 

^ 1 

I 

• * 身 - 

分布. 

^ 0 B . Y ... V 66庇各.瓶兹55粉4 

Kii- w y4 ; 1 ^ ， nn *x/v (=i i»ru—r- z^\ 

2 X 1 + … + X n 

/n(^i ， … ，工 ” ； A)= — j - 7e~^ 

J：i I •••：!：«! 

^ ▼ ，■罗 

A 的先验分布密度是 

夂⑴ = r ； i a_1 ^ ( x ^> o ^ 

、 \ , 、， ^ r % ， ■— r y 

根据 (2. 3) 知 A 的后验分布密度为 

n 

^(A|x! ，— , - e - (㈣ A (A > 0) 

其中 A 是与 A 无关的常数.这表明后验分布是参数为 a + tx ,， 

i 

p + w 的 r 分布. 证毕. 


v # v 





定理 3. 3 设兄，…，又是来自指数 分布尸 （ x)=l — e — “ ( A > 

r\ - r\ \ A At 4^A 2FL % AA AP ： tt 人 / V 曰 ^4^ JlL- r\ AAt mi / V j Aj rnil 

u ， 工忏平 • 叹诊双 a trj 兀题 万叩疋 诊双力 a ， p tsv [ 7TW ，火 _J 

. • n 

在 ^ ，…，又下 A 的后验分布是参数为 a + W ，^f 的 

1 

r 分布. 

证明：足，… ，又 的联合密度为 

' n 

f n (工 1 ，… ^ x n ； A ) = X n e A 十' • 

4 

% *4 

m . if ^ -rr A . / \ ■ /■ • j i \> 

a sy 宂湿 or 作钳误:刀 

e ( X )= CX a ~ l e ~^ ( A >0) 


从公式 （2. 3) 知 A 的后验分布密度 


1 KX 


l • 

— 一丄 ^ 


，: T «) =^AX 

f ~ r fg ， 


cr^nr—1 



n 


可见后验分布是参数为 a + n 9 p~r ^ 2 Xi 的厂分布 • 证毕 • 


1 


定理 3.4 设不 ，” •，又是来自 AKpcy 2 ) 的样本，苒中 tr 2 已 
知， / i 未知，设 / i 的先验分布为〜("。，4)，.则在兄 = Xi ，…， = 


蓋 蠢 蠡 — -蠢 瀣％ 身 ‘麯 __ _ ^ ^ ^ m 詹_ k 

OCn 卜， / i 的后验分布为以（，，（，尸），其中 


朞 

n 


fjioO 2 H~ nal ( 工 ） 2 
( T 2 + 


n 


JO 


y ; 


X 


(3-1) 


( C 7*) 2 


_ 


o Z d 


o 

( X 。十 


(3.2) 


iJFHfl . Y 


..... Y 的雔会瘀麽 

. 7 7 - - n ” v V I—I l-M / V 

^ ( nn ••• nr> m m m ^ A T*\ 

J n V-^l 9 ，乂 „wiAp 


1 2a 2 

这里 C 与 ^ 无关.又 / i 的先验分布密度为 i 


MJ^ 


X 


、2 


尽 ("）=Ci exp 

从公式 (2. 3) 知后验分布密度为 


(/ j —/ io ) 2 

2al 


芒 (" I 


JO 


f x n )=Aexp 


n 




2a 2 


(/i—x) 2 — 2^-(^—/io) 


?77? 

9 






其中 A 与 y 无关.但是 



(厂幻 2+ 含(" 


Mo 


) 


/ I V 

LW ) 


I 


2 "( 


n(x ) 2 




其中，由 （3.1) 确定， B 与 p 无关.于是 




oT m 百胳从太且 \ JY „ V ( ^、 4 TC 比 

， M 夕 LJ /M f - J4 'IH >AC, ‘、' <卜 y VI/ / / • m- —r - • 

从定理 3.4 看出,，是1与^。的加权平.均.这与直观相符, 

2 : bfe -4 - i4Ar 汝 rbfe T* W 

ao 嗯八， "o trjm 嗯1、里文 • 

T* ■« r C3 ■■! 一 、 t i 1 \ 上 L _> - ■ t JL«> > 

疋埋 议 Ai , —, A W 定术目 i \/ 匕沖 ， K 


未知，设尺的先验分布是参数为 a ，/?的 r 分布. 则在不=々，…， 
X w = x w 下 ，尺 的后验分布是参数为，，//的厂分布，这里 /=a + 


y ,^=^+ Y ^ J ^* - 户) 2 . 

证明：兄，…, X 的联合密度为/ 

f __ , D\=r pf 。-知 

J n \^l J 、 ✓ 丄八 -v- 1 

G 是与尺无关的常数. i ? 的先验分布密度为 
’ •^( J ?) = C 2 ^ a ~ 1 e^ R 

从公式 （2. 3) 知尺 的后验分布密度为 

r - —■ ▼f，- ， ， -■-▼，■» 擊 ■ ■ V ■ _ ▼ 

* 

r - o 0+4-1 ， o +£ (x .〜 2 ) 尺 

- ® C i 

I 

可见后验分布是参数为 c / ,，的 r 分布. 证毕. 

TTir XA-* /-t /V AA -U* 4fK^ /V -A- :11 、斗广 ^\、/ o i 

乂 / j 饥九 tn ; 六， & 万邗 ，， i ； d ： 疋乂 j •丄 • 

宝义 3.1 称 X 服从叁数为： Tn >0, a >0 的 Pareto 分布，若 

▼ _— _ 了 *<# —— ^ V r » ▼ — _ ^ - f - , 

它的分布密度是 ‘ 


• 777 • 

f 9 



[ 0, x < Cx 0 

<p{x^x 0 ,a)=\ 、 

lax 0 x , x ^ x 0 

定理 3.6 设兄，…，又是来自 [0，(9] 上均匀分布的样本.芯 

n aJ- Tt 人 /V F=l 办 >1 ± f\ 上 “ i-fc /V mil -^r* __ 

o 的兀题 or 叩定麥戮万 a 0 ^ a tiy rareto or^rp. 卿壮 a! = ，…， 

X „= x „ Td 的后验分布是参数为 + n 的 Pareto 分布，这⑴ 

r * r • w - ▼ r w ▼ ■ '^r' _ ^ ^ ^ ■w - ■- ▼ ， ■ 罗 ■ — - 

do =max{^ 0 ，工 1，•••，；}• 

证明： X ，…，兄 ^ 的联合密度县 

- ^ -w - a - w » ▼ w ， v V ■ ， * -w ， 


f n (工1， 



n 


& 1 


* ■ 1 
丨 a 


* ^ f ■ 

1 _0, 义 I v^i / 


ml 0 的先验分布密度是 



(muv ir . ^ 

、 a a va ^ i x 

l < f<n 


<p(6 ； 6o ^a) = ^+r^ 0 ,oo) (6) 

… , 

根据 (2. 3) 知 0 的后验分布密度是 

芒州工"…，工„)=八^ [0 ,,](11^文工:） • ar ff_1 I K , co ) (^) 

= CJ[〆 。 ,CO) ( 汐 ） • 0H 一 1 

这里 C 是与 0 无关的数 ，劣 = max (<9 Q ， …， : c „). 可见，后验分布 
是参数为成， a + w 的 Pareto 分布. 证毕. 

以上都是讨论单个实参数的先验分布，以下讨论两个实参数 


的二维先验分布. 

定义 3.2 称随机向量 ( M , 尺)服从参数为 (；4， r ， a ， 的的正态 
r 分布，若尺的边缘分布是参数为《 4的 r 分布，而在尺= r 下 iw 


的备件分布县 N I U 


rr 


杖时 （ M . i ?) 的分布密麽为 


<p(m ， r;fi ， T ：， (x ， l3) 


Ha ) 




定理 3. 7 


<#*%■ ，, 



— /3-\ 


设兄，…， X ”是来自 N ( M ， 去)的样本， 


^7 R 





知.设的先验分布是参数为的正态 - r 分布，则 

-X- T ， y Tk jr r% \ tt 人 ， /V -A— 4=1 itCL^ \t ^ / * * 

it Aj=j：i ,-^^ n =x n r ， UVi,A ； 的历诞方叩定麥戮万、 " ， r ， 

〆 ，， ） 的正态 - r 分布，这里 


* 



TJJL "T nx 


* 



r + w 


r n~n 


* , n 

a =a 



n 


* 




r ) 2 

w ， I 


m (x — fi ) 2 
2 (^- 1 ) 


丁 


n 

V 


X 


明：/"…，的联合密度为 


f n {x x , — ,J 0 n ； m,r)= ( f^) exp|- ( 工 t 


m ) 


( M ， i ?) 的先验密度为 


r ( a ) 




,a 


T 


exp I —/3r 


rr 


(m — ") 


从公式 （2. 3) 知 ( M ， R ) 的后验分布密度为 


P(772 , r \x 


X 


ym 


• 厂 z 


exp I 


n 


2 


/ \ 2 I / 

\Xi — m 厂卞 rym 


r, l 

P r j 


由于 


n(x — m) 2 +r(m _ ") 


nx +r/i\ 2 j nrix—fi) 


/ i — 

VT 丁 nj \ m 


— n 



r+n 


■ • t==t 

卞是 


^(m 9 r\x 1 , ••• 9 x n ) 

K 

Cl • f+t+exp 


r+Ti 


r(m—fjL* ) 2 — 尽 r 


<p(m 9 r ； fi* 9 r\a* 


9.7 Q 





即后验分布是参数为的正态 - r 分布.证毕. 

T-#_L 办 »iu^ JLt* X/-. Trr* t\ t 、 - T- rrd JLU t h M tri—、m — - Ail ， 

別丁网麥戮 ， P j 以 lit 明七 的升抓 甘仲定所 谓…琲 

Pareto 分布. > 

― •島 -^/ / ■w -w *w ▼ v Mt—t • • /、 %t## ■ • t .#. # _ * #. # I 

足义 3.3 杯 Uph ) 服从穸奴是 n ， r 2 , a 的二维 Pareto 分 
右 ( V ,< rv « 日 m . 甚古的你右你鹿县 

'r* V * 1 、 • 乙 -JLJ-. V * ， V ， 7，|_| L-* MV XV ' r* U-l 


g(yi ^yi ;nr 2 9 a) 


g(a + l)(r 2 ~r 2 ) 

. (v?.~ Vi ) a+2 
— ^ * 


a 


— oo， ri ] (3^1 )l[r 2 , 。 o) (3^2 


(3.3) 

宙捆 18 份 Y, .… .Y 县 . 白「从 . 义 1 h 也勿公右的従太 . 

v ■— ‘丰 17 7 * ^ n / 1 、 1 —I l v i 7 v 厶 j 麗 • ^ ~v _ v p h 豸 1 1 1 ▼ 

久<込未知.设(久，氏）的先验分布是参数为 n , r 2 , a 的二维 Pareto 

分布，则在 X = ^,-, X n =^ 下，（(^，艮）的后验分布是参数为 

/ 

r [ , r 2 # ， 〆 的二维 Pareto 分布，这里 n * ^ minOi ，工 1 ，…， A )， r 2 二 
max ( r 2 ， j ： i ，… ^ x n ) ^ a * = a J tn . 

证明：不，…，又的联合密度为 



J n \ 丄 1 




9^-rt 9K/2 / 



[沒 1 ，沒 2] 
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I 

J[^,oo)(min Xi ) • I(-oo f ^](tnax x { ) 


.A) 的生骑浓麽县 nn 相拒 /A 才 P :. 化 Y 的曰龄公札 

、vrjL 7VT 厶， "W/U l-M w w ， • I H 、 _ • V ， ，，n XVI 7 V ^ X Hi v /»-4 VJO* • ,， 

密度为 






_a(a+l)(r 2 —r i y T /n x T “、 T , • 、 

- ( < Q 2 —Q l y+n+2 ~ i (-- ， r 1 ] KOlJllr 2 ^) K0 Z ) V mill 

X I ( -oo^ 2 ] (max x t ) 

m —n \a+«+2^(--*r ； ] (^1 ) hr ； ，-) (d 2 ) 

W 2 l/l / _ - 


=g(e l ,d 2 in 9 r； ， 〆 ） 

、- V EZl * * # / V □»! m —X— j-^-t -rtU 上 / Art 、一 m p-*. t ? 人 / V W jC^h UfiL> 、l * 

込生 n , r 2 ， a 方別见 平疋牲的狱边. Kl 见厄题方仲定麥戮刀 

r* %r* nfy* 的二维 Pareto 4V 布 . 证雄 . 

I / W~^ ▼ - _ --- — / W t ~ W I W 

对于多维分布的共轭分布，我们不做介绍.读者可参看 [11]. 


<?«n 





对于一般的分布密度(或概率函数 )/( r ， 仍，如何找其共轭分布 

上 —irf — /*%—# _ 丨 • ■ • j i— 智 f f 圓 jl ■應 r . i : § ▲ k - > 丄 # _ l * § l /- 為 _ 、 • 

肤呢？莸 1 U 孭出，只安秤不 A ，…， A „ 令回疋维奴的尤龙绑 TT 重 

= ，-, x „» 

』 _ • 鑫 k 麈 ». _ mt m. a0 v ^ m m • •> » m 一 ^ *v b m i* 塵 _ 

ik^n 尤夫），卿有一艰方法找出共扼分布族 . 

V . ... Y 始庇各你由右 TT 方 ll >4 V 做才一 

zIi ， j w>n/v « U4 a->c n p y g J4 mr • 


/” （工 1 ，…，工 ; I ; 玢) 



\\J ( Tf 


r 丄 n 


n 


JL 


\ a\ 


/q a \ 


n 


假定 


o < 




— Jt -__ 4 k. iflA 

VAt ， d ) dd < oou ； 




e 


令 


D = { ( t 9 n ) :存在 n > 1 及 X ! ，…，: r „ 使得 




(<pi (工 i ，…，工 n ) ，…，科 （x 


A ))} 


g ( d ; t 9 n ) 


Vtl \t 9 0) 




V - At 9 6 )dd 
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我们可以证明 G ^{ g (0 it 9 n ) : ( U ) 6 D } 是 /(« r，W 的共轭分 


m - % # _ 

布族. 


设尽它是沒的先验分布密度，在兄 


尤 =^下 <9的后验分布密度是 


冬(夕 | ，•” , x n ) 




rr ( a . * 

j w v^i ， fvy b > '/iv 




(3.5) 


9 


f n ( x ，\ ，…， A ; d ) g ( d } t 9 m)dd 


设兄，…， X , ，…，独立同分布，则 


v! fn+mioox ,x n9 yi ，…，: y m d) 

= f n ( x l ，-•- 9 ± n ；6) • 人 （: yi ， … ， y m ; d ) 
取: ^ ，…，使得£=了(：^，…，30,对给定的 
7 Xj ： i ，…， a ，： yi ，… ^ y m ) ，我们来证明： 


•« • — i 廬 . •■* ‘ • • • • — J# 身 -Jj^JL^ . Ik ’ • ^ • _ 麄 * .聲 Ok. ■ A rn^mrnm^ 

W 里一舣地，口 J 用仕柯别的测 ® Nidd ) 代晉这里的 Lfebesgue 测皮缈；当0是主 

多可数集时，这里及下面的积分均应改为求和. 




Qsn 


_ 



1 ，…，: 0=^( 汐; w ， w + m ) 

ttzl L ft / o >r \ A*ti 

失 P4、_[L ojy^i 

芒(列 X ! ，… ，: T „) 

_ fnixi ，•-- 9 x n \ dWinit , dyhiy \ ，- •- , y , 


J 


X 


<9 


9 x n idJ ^ Vm ( \ t , ff ) h{yi 


* 

f n { xi ，•-- , x n \6) f m {yw yy m id ) 




f 


& 


f n (Xi 9 ••- 9 X n ； d ) f m (yi f …: Vm id ) dd 



fft 




，： yi …， y 


in 


ff ) 






e 


ft^miocx, ••- ,x n ， 3 ；i r^y m id)d6 


V 


U/T 


Vn ^ miu . d ) 


■w ✓ y% V 1 

v ^ m Ku , ti ) atf 




一 / /! — I 

^ yuiu 9 n t 


e 


r f . v w w -g y ^ r # _ w . t ■ jl ^ a 』 k v ^ .丨 ■ —• a # v ， 灰 r # jl ，- 11 

作为不节的禾尾，获 II 』介绡厂乂无膛分帀的概念：衫上仕例非 

负函数 gO ) 称为 (9 的广义先验分布密度（又叫权函数).值得注意 

* ▲ rnm^^m -■ - • jl ^ ▲ ▲ » ■— _ • , — ~ ^ _ fc 羞 - » • ‘ _ ▲ - — m. _ bte 

的是，虽然 ^仍可 能不是概率密度函数，但是公式 


d 


• fi 、 rr ( fi \ 


1 ， … ，工 71) - 



/\( 工 ”“ ， 9 x n }6)g(d)dd 

& 


(当分母有限时)仍然确定一分布密度，它仍叫做0的后验分布密度. 

1 ^ > ■■ 、 _ • rt ~^ I-it r—I 上 Lr^ _ r mi^ A • / \ i-it t v i / 、 _ -Tr~» l=i=i 上 L m rt ii 

仕头怀使用災吖斯万法时，思安允甘利用以仕积系的刈识，即 

确定先验分布.若以往一点知识也没有，怎么办？此时应如何确 


定先验分布？ 

沐木番亜卩51缅次么拈丰做也 _ 仲时沿 右你一的 / AU 的古吐跄 

^<2. I 平 - - n 7 門 /|、/irr w" j 口 «^/u ^ w *vu 

定先验分布.有些人愿意采用下列 假设： 

门 、 : Hi a-fn ( — Pffir 估 口车止必如 413 油 1 十、、/出必八 
、丄 / 句 U V ^ ； _x^>fK ta 9 JtlLVUyU^ V/S f ) J^JU^L J4 

布（权函数）应取 g (6)= C ( C >0). 

/ o \ n /r\ "HTt A*? ——/ n\ 曰 /r\ zCit ， t> L* AAi _^^ nrft 6-4* FTTrl /i 

k^j 石 （7 m cv 丄取 ia ， y^v(77 疋 o 太 _j f 丄 trj 一一 u 

无先验知识时 © 也无先验知识. 

- - _ ， - a - 「 — - ，， ， - 

(3) (9 在 ( a ，6) 上取值 （_ oo < a <6< oo ) ，权函数是 g ( ff)，<p 给 
• 382 • 


( d ，6) 上有定义的函数， 9/(: c )>0( — 切 X )或者 〆 （: C ) <0( — 切 

、 m»l -：■. _ / 六、 jll* 丄 r* — ^ 山 ,- 、， - /Tn 

x),m 的十乂幽 级万山 

/ i (0)= g ( 9 - 1 (0)) , ,, i 1 /;,；- (3.6) 

\9'屮” 

这里 ^ T 1 县 a 的反函数. 

_ ~r ， r w " '"w ，•^ ▼ - - • 〆 严覃— 

* 根据这三条假设可以推出：① （0, OO ) 上对应无先验知识的权 

9 

c r 

%.V# T ^ i _ ■* %. • / jr ^ fc. ■ te ^ . % mima, *. # 一 ^ 廬 # _,_ ___ %. ■ 鑫 • » • - -- I ■ 也 鼇, 麝象 ^ lL A M _ _ • 

凼奴应取② （0，1) 上对应尤先骏知识的权凼数 应取^ Z 0. 

应该指出，上面提到的假 ii 中的第一条和第三条只是一种来 

* * 

自直觉的设想，并无足够的科学依据，从这些 is 设所导出的结论是 
否合乎实际还需要通过实践来检验。 

*§4应用实例——电视机寿命验证试验的贝叶斯方法 


电视机的使用寿命是很重要的质量指标，所谓使用寿命是指 

% 

It "■ ■ ■ ■• I 人 / J . >■ ■-# " 膠 | 血 fcl Lrrt > i ^ # #. — — I _ 八 • # f . ik t > ■ 論 # #. ^ t ^ 、丨 > ^.K 丄 m M ^ 人 

从开炻使用到规疋的切酡设天方止饥绘坊的时问，彐然布里寿茚 

乍垤鹼卅由洫如的吉合县岙冰刟厶故烷准啦？劣 

广 4 • 〆!>!*、 I I v-o* v u ■/« 1/ u m v , M 卜 ■" yst-. i—i |«| I H kj ， • i-^ / u • 1 

然只能采取抽样检査的方.法.这实质上是个假设检验问题，数学 

I * 

I -皆嫌 4士 ： ftnir 姐描商 rib 々 k 66+ 县粉描 HT >1斗 t 由棚 如的 志合 

-L- rp 4m I • ㈡ r 】 / ■ mv 八 里 4/n 9 ^4 k^\ i^v nr* i^u i/u mv ^ mh 

X 服从指数分布，其密度函数如下 


I 


f { x , d )= 



rv 


% 

4 I* ^ I . a ✓ ^-w v t~l _t m, m ,^L^> / . lit 、磬 'w 'r 八 a 一 _ t tt f ^l I p ± ■ 菅 ■ l_ # i tr An " 

兵甲 CU ， oo ) 是木刈麥奴.囚刀 iLA = fj ^ MH 慨干叼％既障丄忭 

时间（记作 MTBF ) ，即平均寿命.通常取定两个值汰 ，Ui < Bo , 

%. % M. ▲ 一 . ••歲 一 ^ 蠱 •秦 鑫 > <■ _ * • ^ ^ # _ ^蠱 》 • • ’ _ _ ■- • ■■ 癱 k • - * ▲ A m ▲ ^ ^ 

这个的叫极验的卜限值（在验收 N 题甲，干均寿谛仳于的时小应 

接受，氏又叫做极限寿命水平） do 叫做检验的上限值（平均寿命 


% * . 

t 驂 ▲ ^ ^ _1 — * » ^ ^ • ■■— a ■,■ ■ 氮 i - >• - _ fc - ■ •麝 % __ 龜 _ . i ■■ ■ 氮 i i • M _ m ._— » ♦ I ^ - -*■•—■ • 1 * 鑫 會 • i 

o) 当 gw) 是 0 的晋通概羋密度时，从初等 m 羋论知 ： 0=y ： 0 ) 的概 羋密皮止妤田 

(3. 6) 给出.故 g (0) 是权 函数时，人们想俤0的权函数也应由 （3. 6) 给出. 



高于乳 时应该接受， (9。 又叫合格寿命水平），比值叫做鉴 

□ rl I t* /各 /r^ Tt 入 £±x. t=t 、 - X- II L J4^L XtTt 丄 " ^-U tt^ 丄 " 40* XlU 

力！ jcl . 沉 tnjiA 题刀朱定込忏的：久一入 tfiL 电优似 lt wa 似 l 烟取 n 

台，同时进行寿命试验，试验 G 小时.在这 nXt 0 个台时的试验 

» ft 、 * u # » ^ W \ . # ^ W k ^ 一 • . t A. » . fc A U » * » ▲ I #_t * >■' ■■ ♦ % 丨 ^ ^ » # 

甲，电视机的天效奴方 r . 当时判足整批贫格，便用万 接収； 

劣时生〖 I 由敕各故估田士 ; iGiMr 4令木 r 

―1 # ^ *-* j y g /m— oe: jvu ' I - m im t l^/ u yj 41 ^ n^» ^ 2 . 1 ^ … 1 m i w / -j am^ 

数，是一个非负整数.通常称: r = nX £。 为总台时数.这个验证试 

TlA. -t* 由山 —- 人在來 fr •_ ▲ 广 ' Zd 士 主央 ifr AA -fc3i JHtt 故工 TTT? tit : S itit 

mjj ^ r^ypL n 9 i 0 ^ 烫双 cnjjziitr 千 m 秋 j 内大 th 吹巾 

^ * 

来的风睑的允许倌.用 L ((9) = h ( r < C ) 表示平均寿命是 (9 时接 

• w -■ ▼ 严 ■ 『 ■ W » -W V ， ， , 'W 'w ■ ， W T 

V 

\ _ 

/- ▲ U V 上 L Jjjj* _ 〆 f ■»■ / a 、 m ft I m LI. I~\A 1#| V mi f /H * I . 

叹蹵孤的 m 半， iAOWH 慨捆怦苻饪凼奴 . a = sup r ^ rP > U；HHiiKgE 

' 似 0 

产方风险，即产品寿命合格却被拒收的概率; /?= sup n ( r < C ) 叫 

e < e l 

做俅闲古 RU 令.刖产品不仝格 in 被培收的概銮 _ 可以证昍。= 

，、、，賈 ，厂 ， ' ，-_ / r^p-i l s f ta -i ^ 内 V 17 祕 , * ^ ，，， ，， 〜 

Pe Q ( r > C ) ， M \ ( r < C ). 有下歹 (1 公式‘； 



(理由见 (4. 2)). 利用这两个公式就可对给定的《，/?确定出 了和 C. 

e 1 * 

在以往通#的彩色电视机试验中，取^1 = 15 000(h)，^ = 

% 

a r r\r\r\ / *L \_ 1 r\r\ _i—1^ nA. n-4 - iVn 1 — 1 r\r\/\ / "L \ -^r* T -、/ _*_ — 1 r\r\ r\r\r\ 

4 ：o uuu vny 9 n — 丄 uu ， u\ 3 EP'j jnj Iq 一 丄 uuu v 117 ，仕 i _ n 八 Lq — 丄 uu uuu 

台时试验中失效数 r<3 时判为合格，这时 a = 0. 20，p=0. 10.可 

k v I — » 1. 1 . t.r r / L Wa. .il 、 r -rrt . i . trt * « 八八 n / 上 l n A. 丄 “ li r 山 -i 、i 

以有 ffi ，仕多孤父 1 可狴叹辽侄甲句 zu / o 的 M 重甘佾孤傲刊刀 
席暑不会故而遵拓 iMr 

/^% ^ I »--| I M 1» V ^J A*rt^ 4 ^ iy^ 9 

» ^ 

lk _* M • » M ‘ 息 . % 轟 --▲ . • *二亡 . 邊 - Ifc - _ _ 耋麄 1 • 麄扇 ~ • - 黑 ▲ %, #■ _ ▲ 

这100 000台时的坷验买行起来很小释易，贾时贾电，随看彩 

. - 

由庙县66坦宜 it 亜 a4 4x lwnnRT? ir kh /3 ^ oa nnn u mu m at ^ 

/X 里 My 4AC |«=u 9 Wl- _，▲ i I U1 〆；/ tJ\J \J\J\J LL y WJ | J 

134.000 台时的试验(鉴别比仍为3,下同).若要验证负为30 000 h, 

mtt TFFT or\ 1 r\r\r\ n~L AA» » TtA. I . TCT VS7>C 山 r=l rr-U >44 - 二 » TlA. TFFT ~izT -V 

；WJ 而女乙 u 丄百口 、 J 丄 tl 百砂 屯 1 口 J 口、 J 32T1 了巩题而交双 tl JA 

方米的髙温房，仅一次试验就耗电26 000度.可见，这种既费时乂 

， ▼ 9 ，，▼■ ， « - ,， ▼ - "W T - ， ■ '»^ r 9 — ▼ ▼ • • — ^ 

费钱的试验方法，显然不适应彩电生产发展的形势. 


^fid 

1 





由上述可见，对于高可靠性产品，用古典统计方法建立的抽样 

nA. ||/^ Tt 入 H -T-* 八 I -«v^ 厶厶 /)-!«>/ /X -r.rl td r~r rcn 田 +i XA* •XU ~r- 

题 HXTA 现定 个昍々 '八俩思 mi. 双 1U 似观利用 Ci 仕识糸 胚木的大丁 

平均寿命0的信息.换句话说，应该另辟捷径.，从贝叶斯方法找出 

nM ^ r ■ 譬 _ # t # \ i t _ 鑫 ##. A ^ • t » # _ » — M -—. ，鼴、 t 1 1 ■一 - i »^. >■ „ ft 、 ... ^ j _ 

m. 茯困邯分犹 tr 丄作有卞 zuts ： 纪 so 牛代甲期米用 imbt 斯万法 

闹井彩由制空 m 拓的路 初：古宏 _ a ^甜了“闹劳校难， msr u 粉學 

"j |=| / r ^i im' 4 i-J-i /jyi h v -gua ku- j^9 y h>kl -j ^=^ «i^ ， i m=m 

角度对此进行介绍. ' 

( —\ 并生 极山 yrffte? M △&+ T - HB II M4K 

v — / 日几 wcLuixiHj/t 必口 h'j ± nu uv 祖 t Kxxwt , HDc/yvnym 

率分布 

n' A'-t -M rfe 4A >—tt 入 >n_ ~rr x/v ri_x -/-* / 、 上 m 上 " 4*tl i 、一 u t » 人 

伏 1U 专依 书甘快 的讯题.议开俯叫仴屯恍饥 仅八说 现， 

一日出现生放.就拖一台新的继统试验.试腧讲杆剞啟台时数为 

—■ 一 _ •■ _ ■ 1 -，从/ %* 、 t —• ，钃 ,I ^- I * / 、 ♦ ■■ •* ■_ — I _ ^ ^0 ,!■*•， f —• ▼ ， , ，节 

了时 停止.设 r 是停止时的累计失效数，则有下列基本定理①. 

定理 4.1 

P e (r=k) = -^(-^-^j e - ^ (々 = 0,1,…） (4. 3) 

这里 h 表示平均寿命是彡时相应的概率. 

证明：我们首先指出 ，若色 ，各，…,&相互独立，都服从均值是 

n AA> -XS^i Jil^ / V -tr^ Mil tt_L Lit • 、八 一 ^ 

(7 trj 馆奴 冗叩，别 刈一 vj 

% 、 


①若试验是无替換的，则可以证明下列 公式： 

W — - - - ^ —— ，- ▼ — — ^ ▼ — - - - 一 ■ — - ▼ - ▼ ^ - 

P e ( r = k ) = ^ ( ) e _ i " ，是= 0，1，2 ,…， n — 1 (4. 1) 

K\ \ U / 

R ~1 1 丁》 灸 

P e (r = n ) = 1 — 2 Trf ' fl - ) e — + (4.2) 

k=o \ U ’ 

实际上，设 n 个产品的寿命分别为不，…, X„， 从小到大排列为 X m 若 n 个 

% 

I 

产品同时投人试验，则在时刻X⑴，累计的试验时间为 S,= yiXo+CTz-OXov 于是对 

4 = 1 

d 

b <r r,— \ p n (^= b^i = <s,^ ^ «, = v... — y,. .. ( y,. 、= m - ft im-iTP 

， v j- n * (7 \ ^ 打 */ \ e ^e-ri / * >< •*« ■**■、*; — u \ vu; ^ / t • v m- 

明 Ui,U 2 ，…，％相互独立，且 R^U_々+1) 沿服从均值是 0 的指数分布 


, k JH-1 v 

P(r=k)^P e [ < T< 2>i) 


利用下面的 (4. 5) 即知 （4. 1) 成立， （4. 2) 从 (4. 1) 直接得到. 
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(4.4) 


可用归纳法证明.当々=1时，显然成立.设々 =/时(43) 成立，则 
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2 j ^ 的密度函数 
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X — 二 * 丄 

— p 6 - • - p 

& (/-!)! 6 
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du 
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ei 
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可见 (4. 4) 对 k = l J rl 也成立.所以对一切々>1，（4. 4) 总成立. 

\\ / A A \ -fcfr A*n 

/ yvv ^. 

\ - / 


1 / t V ^ 

= k \{ J ) e ' 

设有 n 个产品同时投入试验，若 Uo :;=1，2 ,…， w 


M M r V 

0； 




是一族相互独立同分布的随机变量，共同分布是均值为 (9 的指数 
分布.因为试验为有替换的，总试验时间为了，故试验持续时间为 
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这就证明了 （4. 3). 


证毕. 







从 (4. 3) 看出，失效数 r 服从 Poisson 分布.从 （4. 1) 和 （4. 2) 

_ 
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凡，人 J 儿货伏 WV13\ 逝 r ， 穴从戮 jai 以服 a roisson TTfP. 

(二）先验分布的确定 

、 i 叙 u —rt r I t r—t ^ t 、， r 、，- tm» »■ *. • l » t . i * ■ m 八八 A * 一 一 ■― ^ 、 v^. 零 ^ 

这定米 历災吖 斯万法霹天璉的一 步. 从疋埋 A Z 知个 列班 i : 
斗右①. 

1 r* • 


e ( d ) = ^^$- a ~ l e-T (6>0) - (4.6> 

ria ) 

是 Poisson 分布 (4. 3) 的共辄分布，其丰 a ，6 是正数. 

銮际卜，芒取 （4. 6) 为/9的生賒分布來麽.甽#生放教 r=k ^1 

， ■ ， ■ *■ - , ' i—i r *，' —署 — , ，， ▼ W—r ^ ^ ， ■■ 鑭 - ，， -■ ▼ |_| • ■ _ / ，, Z 、 1 ▼ 

条件下 4 的后验分布密度为 

^0\ k ) = VC ! ^ a+k+1) e ~^ (4. 7) 

i \a~T kj 

*• 

故取 (4.6) 为 0 的先验分布.怎 挣确定 a ，6 呢？ a , 6的直观意义不 


明显."但先验分布的均值£：歹及10%分位数九（即有 P ( d < e L )^ 
0.10) 有明确的直观意义.有下列关 系式： ! 

E 6 =-^r (4.8) 

a ——丄 






0 L ff 


r ( a ) 


r 


(a+l) 


d ^=0. 1 


(4.9) 


若能根据历史数据近似估计出 Eg 及久，则从 （4. 8) 和 （4. 9) 

〆 

T^"STt4^ 山 _ 7_ 

肌 HJ 小 cq a 9 u . 

为了刹用历电数据，对全国15 个企 仆牢产的22种型号彩电 

^ ■▼丨 m ■ ■ r w — • , ^ r ， r ， »■ ■ w 

的寿命数据进行了调査（包括实验室数据和现场使用数据），经过 

名汝研奋.你产品榕妄命斗谳二银.公 钏识洳 妖曰枏抿昝 

|\j/ p-i p-i ， vj r*r# / 钂 >rv ^4 7 /v / 碣 4 ru^ z 4 今 、、 • * 7 j\\y / t—f 1 鈐 、 ►—i 

理经验和历史数据确定每级产品的 6,(9。 的取值，鉴别比 d =3. 
P 9 Q . R 三级的 A 分别定为15 000,20 000和36 000 _h， 根据历史 


数据，取 £6=36,. P ， Q ， R 三级的心分别为 0. 75负， 0. 90 久， 


①称^服从逆厂分布，若 7 _1 服从厂 分布. 



0. 95私 •以尸级为例，取 000； d L =0. 75^-11 250, 

■ - ^ ^ t ■■鲁 ^ m v /屬 ‘、 秦 ■— 、 • ■_ bf # * t . A . # \ f t _ # # . _ g g ， 灰 h > I _ 二二 —_ 

再利用 U . 8)、（4. 9) 经 tr 异机异得无狴分疖干的网个多奴卯卜： 

a = l . 956， 6=2. 86豸 - 
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对 Q 级 A 级可进行词样的计算，总之得各级所需的蔘数如下表 

/ y \ aj> : 


、\ ^数 

( MTBF (平均寿命) 

先验分布参数 

级别 
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[=.) 租 Ut 力朶 HV 制疋 

验证方案由 （ T ,： C ) 两个参数构成.了是总试验时间（台时 
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奴）， C 是贫格刊疋奴.当诨狴悴止时系 tr ) 天双奴 r $ u ， 则刊疋孤 

合格； 当 r > C 时，则判定批不合格. 丁 , C 如何确定？应使后验生 
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严万风险，及后验便用万风险 f 郡达到指足的氷平，这里 

M. I X 

a "= r^^o I rp > u ； 


^=P(d<di |r<C) 


可以证明有下列计算公式 
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M 為 
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(4.11) 


其中 r ( a ，: c ) 
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是不完全 r 函数，而 


♦ 


388 









P(r ^ C) = P e (r ^ 0^(6 )dd 
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是接收概率，这是一个无条件概率，表示 0 的先验分布为 （4. 6) 时 
产品被接收的概率. 

证明： 
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由此知 （4. 10) 成立.同理知 （4. 11) 成立 


证毕. 

▼ - r - w 


对于 P 级产品，仏=15 000, a = 1. 956,6 = 2. 868,取 f 
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0. 10,由公式 (4. 11) 可算出几组 （ T ， C ) 的值，再由公式 (4. 10) 计算 
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4-ct i-Vf >4 At 77 人 zl- "Ar —m IT 人 * •rfe 

T 0 M trj 瓶土厂刀 )^m a ，1 守 P 衣： 


p 级产品 的贝叶 斯方案 


: C (允许失效数）, 

1 

1 - Ji 

, • 

1 \ 2 

3 

1 

: r (总试验时间） 

25 389 

36 421 - ' 

47奴8 

a # (后验生产方风险） 

0.044 

0.019 

0^00 8 
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方案. 
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赶以汉見 V 」化: W 刈贝丈戮诚 miTT 饥，涨〗呗仗用刀 W 王广刀的 

刺益，悬后在验收杬准中对 P 级产品诜用了 C = 2 的卞案 ，汶时 试 

P ， , V ~ * , ，攀 ■■ ^ 9 r ^ ' , V f r - ， ^ '，，， P "* 『■• r ^ r ™* _ ^ ▼ ，_， / 

倉- mrnM , f M MV I , I A , # _ # ^ • £^. ‘ • f 、 i 貪 ■ ■ ■ 、 ft# , 

狴忍 n 时奴 i =北 4 Z 1^^/ UUU ， 是原.米的绘典救叹万茱贫吋奴 

擊 

T =100 0001% 27% . 社就++减小了^胳丁你畺对 O 挪7?银 

* w " v 7 ^ 47 U / 、 / 、 y^y\ ^ ^ m- — ^ i i - j 

产品也选定了验收方案，总结在下 表中： 


骏收试验万栗表 

c )隸 

级别 

77台时 

c (合格判定数） 

P 

37 000 

2 

Q 

32 000 

2 

* 

R 

20 000 
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I '/ P 4 S _ hf 命如八妨7如命4•^田 m 咕抓士吐4杏类 TT 1* 庇玄 S 9 

\ 7 '^ J\ ^R J >H |”J 也 川 >S p I 7SM ? 伏句 "J 7JS J 。 

, 

中的内容加深对贝叶斯方法的了 

女 I- t^ihh^jtlkl d-1 a 且泊 f m 生必几女初 瓜 t 土 B&^rcb M W 6^ 必一 ；!：4 士 

肛丄 MU ny 方 I/y 下 9 ^S/fc-T'J m JU^L J4 ，屮 TH/ 口扭刀石 WJ /C 吧讲训口；；进 HL ㈣ 

验方案，使得后验生产方风险〆及后验使用方风险 f 均达到指定的水平 
(/T =0. 10, a* <0. 05) ，并没有去追求“贝叶斯决策”——“风险”最小的验收 
方案.要获得贝叶斯决策，只知道先验分布还不够，还必须知道损失函数是 
怎样的.在制定验收方案时，选取生产方和使用方都同意的损央函数并不是 

交曰热苗 66 童 cb 车访她 Efc 由 “ 索施 ” 《 1 描出 A in 咎番 7T 土::白士 m n+ 甘 tit 

iut irj wv m-i 4 ac, -tr>vu w^ jw 八 m xa. j /、 " j rp rp , h jkti 1、 y's ^i 791 '八 

策了.当然，一旦选好损失函数，则应该追求贝叶斯决策.以上面的电视机 

• ?on • 



















验证试验为例，如果损失函数是 0-1 损失，则不难求出相应的贝叶斯决策. 

# 

目 . 
rr j\ >h i ; 

沿用正文中的各种记号.检验问 题是： 

Hq id^^do'*^H\ ( 沒。〉沒 1 ) 

设行动空间 A ={ ai ， a 2 }， ai 表示“接收”（即接受假设 H 0 ), a 2 表示“拒收” 

(即拒绝假设 H 。）. 损失函数 Ula ) 如下： 

% 


f 0 ， 

d>di 

L(d,a x )= { 


h ， 

dKdr 

fl ， 

d^do 

L(d 9 a 2 )=( 


0, 

d<d 0 


仍取 (4. 6) 为 d 的先验分布密度，其中参数的确定方法见正文. 

设: T 是试验的总台时数（有替换的试验 ），7 是试验截止时的累计失效 
数.从定理 4. 2的证明过程知 

nr I t 

P(d >d 0 \ r=k)=, ^ L 、 17 e - f dt 

十々 ） j o 

P(d ^ 0i I y=k) = l — 1 &l t a ^ k ~ l dt 

r(a 十々 ） J o 

( 是 = 0 ， 1 ， 2 ,…） 

利用微分法可以证明 P ( d ^ d 0 1 y =;0 是々的减函数，从而 P (歹 I y = 
幻是々的增函数.故对任何非负整数 C 有 


inf P(d^d 0 I y=k) = P(6>6o \ 7=0 (4. 12) 

o«c ■ ■ 

sud P(8 y=k) = P(f)^f)r, I y=C+l) (4. 13) 

k>C 

Qim P (R <^TI v= = P( /?, I v= 广、 (A 14 、 

w ▲ V W W I I / ， v ， ▲ X W l / ， X * • ▲ 

o«c 

inf Pid^di I y=k) = P(d^di I y=C+l) (4. 15) 

k>C 

我们指出，对任何非负整数 c ， 必有： r = T ( c ) 使得 

» • 

P(d ^ do 1 y=C) (歹 < 久 | y=C) (4.16) 


实际上，令 

<p(T)= P(d ^ do I y— C) — P(6 ^ d\ I y=C) 

， • 0 7 • 
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i _ r ^ 

C 乂 o 


P(a H - C ) 


( dt 


i _ r?f 

r(a + C)‘ o 


尸 +c- 


dt — 1 


1，9(°°) = 1，故有 T = 


显然 〆 t ) 是: r 的严格增连续函数，且 p(o + ) = _ i , 〆 ⑺ ）=1 
T ( c ) 使得 (4.16) 成立. 、 

给定 c ， 设试验的总台时数为 : r =: r ( c )， y 是累计失效数.令 
• fa 〗， 当 y<C 

—一 I - ^ ^ — 


r (/)= . 

U ， 当 y>c 

我们来证明， y 是贝叶斯决策. 

设6(0|幻是失效数为 々时 0的后验分布密度，具体表达式见 （4. 7) .显 


然有 


^■w 

/ r\ r\ …_ I \ _ r\ 1 \ 1 /\ 

rKO ^ a 0 y = nj = njaa 

• 沒 0 

P(d ^ 6i I y=k)= ^(d I 


从 (4. 12) 〜 （4. 16) 知 
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a 6 Aj i 


hf\d j d ) q \ d \ k ^) dd 


• ( " r % ✓ 八 ^ ■八 ¥ X r \ y 八 八 I ¥ V 1 

= mm\rKU (Ji y=k) jt^KU ^ ffo | 7= 紀 ” 

r Pid ^ d\ I y=k) j 当 是 < C 
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力一刀凹，彐 j^tz py o 
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Ud，8* {k))^d\k)Ad 


f P(6 ^ di I y=k ), k^C 
[P(6 ^ d 0 I 7=k) f 々 > C 
inf r °° L (“ Wl 々) d ^ 

A n 


这表明 y 满足 ( 2 . 2 ) ，故 r 是贝叶斯决策. 

在实际工作中要求试验的总台时数尽可能地小，因而 c 应该取得很小. 
通常取 C =0， l ，2, 相应的总台时数： r = T ( C ) 由 （4. 16) 确定. 
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觀議 




1. 设 X 是离散或连续随机变量， EX 2 存在.试 证明： 为了使 f ：( X _ a ) 














































































( a 是实数)迗到最小值，必须且只须 a = EX. 

n _jn. v B -i*r dUJ^ Ht- Ldb. tr*£: 44t T7* vr -Jtr tA- » DO 止 iztt V _ 

乙 . K_ A 定 两 HX 现迁殊 wat/L 戈 : 里， LA 什 仕 . tM 明：力 JUtE a— a 

( a 是实数)达到最小值，必须且只须 a 是 X 的中位数. 

O -irL *VT V V e -cfr I^n r% _ • _ 八 -hr^ AA> 4Afr -A-* 

汉 Ai f 八 2 ，•••，△„ 定木日 Foisson 7J*tfV 忏平赘 


^ mm — <k 

F{X t =k) 


k 
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(A> 0 ，々 = 0 ， 1 ，.“） 


设 a 的先验分布是参数为 a ，/?的 r 分布，损失函数是 a — a ) 2 , 试求 a 的贝叶 
斯估计. 


4 . 设兄，&，•••， X„ 是来自伯努利分布的样本， 

P(X t = l)=d=l — P(Xi=0 ) , 6 €： (0,1) 


设0的先验分布是(0，1)上的均匀分布，损失函数是 




试求0的53叶斯估计. 

*■ ■« ▼ ， ， ■ ，， _ ■ W ~ W ，■- 

5. 设兄，叉 2 ，…， X „ 是来自正态分布 iVCtl ) 的样本，0是未知参数.给 
定检验问题： 

r w - ^- ^ T 


H l ： e < do ^ H 2 ： d > do ' 

用〜 表示“接受假设 H t 99 ( i = ia ). 设损失函数 如下: 


( 0， 

Ud,a x )= { 

\k(e-do)^ e>do 

lk \ 8 _ dn I ♦ 

p — — W p f _ V 

L ( dja 2 )= i 

[0, 6>do 

其中々 是正常数.若 0 的先验分布是 AK ^。， d ) ,试求出贝叶斯检验. 

6•设兄， X 2 ，…，是来自 N (心 1) 的样本，(—0 X 3,00)， 
焱 =(— 加，加），损失函数 1( 没 4)=\^( 丨 0-“|)(^^ 焱），这里 \^<^) 是 [0,<^) 

上的增函数， W (0)=0. 若0的先验分布是 NC 0，/)， 试求出0的贝叶斯估计. 
如果单次观测的费用为 C (正数），问 ： 样本量 n 取多大最好？ 

7 . 地质学家要根据某地区的地层结构来判断该地是否蕴藏石油.地层 
结构总是 0，1 两种状态 之一； 用久表示该地无油，久表示该地有油.已知有 
下列概率分布规律(其中 X 表示地层结构的状态，0表示石油的状 态）： 
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汍（ 无油) 
汍（有油) 


0 

0 




0.4 

0.7 


女卖录加里泫他5?子油.抓々他苣结核狀本0的椹座为0_ fi . S 现狀本1 
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的概率为 0 . 4 ; 如果该地蕴藏石油，那么地层结构呈现状态 0 的概率是 0 . 3 , 
垒規状态 1 的概率为 0 . 7 . 土地所有者希望根据地质学家对地层结构的分析 
决定自己投资钻探石油，还是出卖土地所有权或者在该地区开辟旅游点，分 
别记这些行动为 A ， fl 2 , a 3 . 行动空间 { ai ， fl 2 ， a 3 } ,土地所有者权衡利弊 
之后取损失函数 L ( ha ) 为 



a\ 

a 2 

^3 


(自己投资钻探） 

(出卖所有权） 

(开辟旅游点） 

氏（无油） 

12 

1 

6 

n / /▲. )*X» \ 

(7i v 书 mj 

0 

ry 

1 

5 


试写出可供土地所有者选择的全部决策（函数）及其风险.求出 minimax 
决策.若0的先验分 布是: $(艮 )=0. 2,抓 )=0. 8，试求出贝叶斯决策. 
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抽样调査亦称大规模抽样调査，是数理统计的一个重要内 
容，其应用极其广泛.无论是政府部门、商业机构、工矿企业、科 
研单位或其他部门，在制订计划、•开发产品、研究现状时都需要许 

冷 /士 白 业 -cm -tr am 拟 -jr 女八 n-4^ -feu -ffi 1 叫 4 二 1 ★ »L^ 总 r；cl A/t 

夕旧屈 、• trj 双俯 1 、兀 tt 口 、 j 女; crij 网且， hx 朱炒 I 而 trj 双 

据.各种各样的调杳主要可分为全面调杳、典 裀调杳 、概率抽样 

"- - ■■ - - — W - — — -— — -r -W r ■ ， ▼ — ^ ▼ — ， ■*■ — w ， - ■ ▼ W •- - W 

调査三大类.全面调査也称普査，如我国若干年一次的人口普 

杳.汶悉谰杳需萆女畺的人 fK 物力和0士间_ 谝杳臬我围讨 

■■ 目 _ t _ - w / 、 , i “ -1^ I • ^ ^ ■ 1 k n f ， 蜃 l,V / I — - ，、 ■ * 胃 , ， J~^L« ^ I f w r 

去用得比较多的调査方法，需要有明确的先验信息，也就是必须 
事先知道所调奎的样本确实是典型的，否则所得资料无太大意 
义.典型调査一般取样较少，但无法客观地估计所得信息的精 
度.概率抽样调査是引入概率统计原理的一种调査方法.1935 
年英国统计学家 Fisher 在选择样本单元时引入了随机化，利用这 
种方法，不但可获得总体的量的估计，商且对这些估计可估出其 
可能的错误.今天在概率统计原理指导下，针对实际情况的、合 

I LU JE»A» Jjnr -rht 4-_U V. > * *->-»>： 丄 ㈣ i=f -Trl r~r-i / cm* ■ 丨 U - vet — -r 上 l /-k— •*«* -i—# 

牲的 m 竿畑忏刀朵步 i ( u 系笙. 刊用匕 IIj 耽町犾 恃巧罪 的佰思，乂 

可大大节约调査的人力、物力、时间.概率抽样调査已成为抽样 

\ ■_■* I 1 A . t . . # , _ 、 - 1 \ - i . ^__ • 1% 丨 、丨身 W # w ▲ V ■身 _ .... _ I M. 身曇、 

调宜甲的王安 万沄. 买践甲芾将这三英调査配合便用. 

传统的概率抽样调査的理论，是考虑从一个由有限个单元组 
成的总体中，抽取一个样本，根据样本估计总体的一些指标.设有 
限总体有 N 个单元.记为 


°U(N) = {u l ,u 2 , 


} 



每一单元有对应的指标值，故有 iv 个指标值 


r m r 1 尸 飞严 

Ui 山 ，…， 


底:总诚 JV 斗章元中抽敢《个_元'(叫，％，…， ') 作为样本，对样 

ft 參 # 廣 A ^ 身 MBkMrilb. IhiMBB 1>>—^jl ■ _ ▲ ft ■義 •鲁 i ▲ •■■_ Bt _ - * W 為 1 . k ▲ 蠢鏖 _ k. m **_ b. 

不的谷早兀测量指标值，得相应的指标值，记为 


f 愚曾 _ /% • ^ 

V^Kl 9 J ^2 9 fj^n / 

(: yi，：V2 ，…，: y”） 是 d，Y 2 ，…， K) 的一 部分. 根据（: yi，：y2 ， …，: y«) 

/4- 2 丄 M /士 A A Jj?n At? 

1 口 H 


■W W 丄 /TT I w I I ^ w - V 

r = M crl " hr2i — ^ yn) 

▲’ ■‘ 

或总数 。 

• f 

Y == Yi + Y2 + … + Yn , 

等数量指标，并研究估计的可能偏差. 

豪 • 

4 这里除了要确定估计量外，另一个重要的问题是如何抽取样 

本的；2个单元，也就是一个抽样计划包含设计一个如何取得样本 

» * 

单元的方案以及确定相适应的估计量这两个重要内容. 

^ i ^ 

一个完整的抽样调査除了有一个抽样计划外*也涉及大量的 

— <i 

现场调査的实践和组织工作.整个调査大致有下述 内容： 

A . 明确调査的目的 

B . 调査_备阶段 

-I A 4 AU T 5 fiL /-^ DP rA . im Tfcr AA Q 4^ 

i * 屈、件 trj 柳疋，明刺调宜 irj m 你里 

” 2. 明确抽样框（即总体各单元如何与数码,1，2,…， iV 建立对 

二 i - 、少 ▲ %. 

M 天糸） 

^ iMr 隹粉据油古达 

4^-1 y^i im 

4. 抽样设计 

c ; 田：*: fsi 类 

山 _ H . I-M ^2 T 

C . 现场测量阶段 

t\ 40 UL -rm IT 人 CT/t. 

u . 双俯义 £ 观 B > r 权 

1. 数据的賒收、编辑 

〆 严 ^ 'W r - ， ▼ ■ ■ ■ mr ， ’ • V 

2. 估计、分析 
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E . 总结报告’- v 

viU JE.A -Ui* -i44 >EFt -r* Arr TW? 人 XrT 厶 A 4U« J^A ^ L JX*I "^cT ti *3 贫 

一仇兀夫 mi 畑仟调宜个仪安甩一 / 「灯旳畑忏 1TX!J ，川 j 丑安书 

良好的组织工作、正确的测量手段，每一步骤都应一丝不苟/否则 

‘tA 八 JLrrt -w^t^ 、SET — t-^ -* * *f - *rt,- r i » 、》 I •> t \t-rt _I_^. J, 、 |—fr V 八 * - A M m L t - >3A \ I—I \尺 

将茧相现调宜的天败 . 囚刀邢怦调食旳误差包筲句冊枰误 茇刊非 
油烂祖荖抽垤舟朴： t 亜县仿田槲东铱朴蒔撖 R 可能 MM / I > 抽炷 

JI-M I I V 、 ^T. • _ | r I _L^ ySL-, / 「 /• / M I^TU — I — r \ //^ 、 - y RU ^LJ y^H ^ J FM I I 


误差，而组织工作的疏忽、测量手段的低劣将会使测量失准、数据 
丢失、记录错误等等非抽样误差大大增加，使最后的估计、分析失 
去 意义. ； 

概率抽样调査中总:体一般包含大量的单元，抽取的样本量也 
是相当大的，因而估计的相合性是一条重姜的要求.对抽样设计 
中估计量的最基本的准则大致可总结如下 :若以 访估 

* R(rij) —ECtij — W)=Ern — W 

称为偏量. ^ 


V ( w ) = E ( w-Wy =Var w -\~ lEw-Wj 

称为均方偏差或均方误差. 

(1) 样本量 n 增大时，偏量与均方偏差应同时变小(若 N = oo , 
则〜时，偏量与均方偏差均收敛到 0), 且镝量比均方偏羞的平 
方根变小得更快.如此，估计量是相合的，且 Var 记可埤似作为均 
方偏差.这样的估计量称为可用的. 

/，\ 、 • UX^ :n-r Y L / 一 、 I 丄 L 丄 一 # trv^ ■ W 产 /A_i JLt^ _ 一 1. H g ▲ I \t v/^ ±J-^ 

tt : 权网 wi 百 rr 的壯孙 ，以匕 II 』的叼力调宏則 7： 小刀佃，岣 

方偏差小者为佳. ’ 

s 9 曲射 rlBIr 知抽嫌 

从总体 { Mi ， M2 ，…，}中抽取样本量为 W 的 一 '个样本.每次 
抽取对总体中各单元有相等的被抽中概率，且抽取是不放回的. 

r 

口 ft vitr» rt_L Xi* I-L* »_1_> AA IW -i / x r JLX« Jnr T>rf 丄上 > Tl ^ •人 AA UI. 上 A* 

即乐一认刈私件 t 食平兀以 i/jv wym 半烟取一 / r 奸平兀，畑 

单元不放回，对剩下的 N - 1 个里元 Ui i /( iv — i ) 的相等概銮柚取 

p ^ ■ _ r ^ ■ w —9 ▼ — ,， — | | * — / 、— — ， ¥—• _ _ r~» , _ _ «# | ^ w — • r ^ 

第二个样单元，……，如此继续，直至抽满《个样单元.这样的抽 


?07 

Ky 9 


參 




样方法通常称为简单随机抽样.但它与本书前面章节，中称为简单 

«r^ 4-tt -UA -Jt- AAt 乂山 l=! /V 士 44A -Jr- *T^ !==! ^ AA 4^A -4 - 於 JZ^ tol TT 4*d tT 士 

限 V L 肝平 tTJ 规 AU RJ TT 叩忏平 1 Rj ，匕 tPJ 汗平平 J b IHJ XI、 TH UiR 见 • 

为了加以区分，以下我们将这种无放回的等概抽样称为单纯随机 

-UI* 1=1 >-r* tlCI -cT? ttt、JU JU* JOA X4A —13^ /dr r*t* F7=t 

畑忏^ ，木用込 竹烟忏，仔平 v ： yiy 2 ， …，: yd trj 取但 m ® 

是所有从 { K ，: r ,， …， YU 中取《个的组合，且取每一组合的概率 

^ — r ^ — — w ■ -- -T ^ - r w v P _ ■ W V _ _ - ▼ ■ W W ~ ~ •- _ W 

J ' 

掏相等，为 1/ C ” N . 

单纯随机柚样县柚样调杳中最某本的柚样方法，苴他复杂的 

■ P ， W * 9 w ^ ~W 9 ~ ^J, w w ， ▼ —• 9^- ▼ _ _ ■ ，， ▼ W ， 9 w ^ ▼ ■ W ~ ， W - - w ' ， ， ▼ 

V 

抽样方法往往以它作为基础.当我们对被调査的总体知之甚少， 

沿右什么信鱼 mw 剎用时.沣沣菜用 M 铈随机抽描 _ 

^ II ■• • I r- » 钂 ^4 * 零 ，， ■ I _ ， t-# • ▼ ^ # I— I ，^ I tx ^ r*f p 舞， 


‘，] 


引逬一个与抽样设计有关的函数 

_ |1,当单元 M , 进 A 样本 

Di _ | o , 当单元〜未进入样本 
引理 2.1 对单纯随机抽样法，有 

P {Di = 1 } ~ j^r » f==l， …， iV 
P{Di~l » Dj,= 1} = C 义 — 丄 /)， 2 i，j = l，•••，N 


( 2 . 1 ) 


证明 ：在单 纯随机抽样下，从 JV 个单充中取 n 个单元的一切 
可麁的情形有 C 1 种，它们 有相等 的出现概率.故由古典概率的算 
法可得 '• 


P { D { 


，N 一 1 


" C ^ ^"― N ， 


，N 


P { D i = l , D j = l } 




_ n — 2 . _ _ 

^ n -2 _ riKn — u 

—iV(iV-l)， 


i-» i , 




KLL^ I • 


通过简单的计算，可得 


E ①） = 令， Var(A)=^(l-^) 

i = l ，…， JV 


£：( DA ) = 


JV(JV——1) ， 




^Qk 

%y 





Cov ( D t , D > )=— 


N(N-l) 


1 一竞) 


= …， N 


( 2 . 2 ) 


h 述单纯随机柚样为保证毎次柚取对各单元县等概的，可剌 




用随机数表、计算机中的随机数或随机骰子等来实现. 


例 2.1( 用随机数表实现单纯随机抽样）调査某一城镇居民 
用于食物的支出.该镇有居民共345户.以户为调査单元，拟从 


345户中抽取20户作样本，用随机数表，作单纯随机抽样 •、首 先按 
户籍册的装订顺序给每户一个对应的编号，号码从1至 345. 然后 

w ^ w - — —■ ▼ —- ■ w ' w ▼ - ~ - m \ ~w yr w ^ r ~ 史 t ▼ *■ ▼ ， 

取一随机数表，从中任取三列构成三位的随机数，逐行依次取出不 
同的三位数.可规定当数在 001-345 之间，则对应的号码进入样 
本； 当数在 401-745 之间，则该数减去400对应的号码进入 样本; 
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其余的 000,346—400,746—999 不要；当某号码已进入样本，而再 

I V 

vit-* i J TTT " L trill l~t 々 十 vJL 一 i 入， P=1 、一 riO 、！/ 丄 "■ 也 / 一 ■ I ■* .4— C3 TTf r\ r\ r\ 

队體到谈 7 码 B 、 J ，删 只畀一认.谷芴 lit 明彐腿1^纸衣十•节码 

999 每一号码出现的概率为 1/1 000 时，如此得到的样本是单纯随 

* 、 j 
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机枰不.卯用卜列随机数表取样.无随葸取三列，此处取 U 、10 

二万 II 笛 一 木麻斗1 ^ mil 1 A 9 总进人找士 笛一木粉 斗 799 姑土 

- ^ 'J • >1^ I J- V iJ ^ ys w 4 -77 MJ^y -- I y ^' • ^ i-r t V^i 

4 o 批为 332,332 夸进人样本为第二个样本单元 .」 第三个数为 .853, 

▲ 士 祐 rm 人 -4-* oi c mil 。 ic . 总 ^4 f i 以 士 土 你二人 4 ^ 士 66二 
W ^ ET . 用 M I 双 yV 。丄 U，；WJ 。丄。 Y 3 ZE /、 汗平乃所二 | 什平平夕 Li . 

如 此继续，可得 173,038,224,008,138,288,200,049 号进入样 

* 

■ a r\ -i r\ f : ~~t ■ i 上 ^ 上 i- ri -m Art —»-* m 广 i a i n 

平. 5、 y 、 iu 列嗯仉 me * 取元，八件的亏码 1/3 个疋 zu ， 則符八力 
=利银途肋加却田 ir iq 州 - ^ii . mm^tm oa ^. o?a .m 

_ ， ^ 警 广” r V ^ / 1^ — ^ ^ ■' _ 4 7 t v — ▼ 7 — — — 7 — ^ — 7 零 

243,025,342,327,310,304 号进人样本.取满 20 个样单元即 

4 M . iU , 

rr 


另外，实际工作中常使用一种称为系统抽样的技术，按照固定 
间隔选取样本单元.如按编号的系统抽样可选取一正整数々，在号 

码1,2,…4中，随机地取一个数，若号码 i 讲人样本 （ l < z < 是）， 

— r w w ^ W _* *^ r r — - , , 

则 ；，A + i ，2 A + z ， …皆进入样本.又如调査顾客对某一商品的态 

r 

度，在商店门口等待顾客，每隔10分钟访问一位顾客，这种抽样常 
常非常便.当总体中各单元的编号是完全随机时，系统抽样可 
看作单纯随机抽样. 


定理 2. 1若 ( A ，…,30是从 { I ，…， h } 中抽出的单 


纯随机样本，则 
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y 
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yi 


(2.3) 


是 y = 的无偏估计.其均方偏差为 

Var(y) = ^(l-^)S 2 

71 \ i> / 


(2.4) 


其中 
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证明 
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(工十 2 


、 ■矗 t - 

址毕. 


N 


系 2.1 ivy 是的无偏估计•且 

t = 1 

” ， ” 一、 N 2 / — n \^o 


m. ■ — — Jk ^ ^ a. — 砉 h J • » b w a ■*■ 

足理 2. 2 在早纯随机抽样下 


幻(歹)=丄(1 一芑) 

n \ iy _ 


s 


(2.5) 
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是 Var (50 的无偏估计，其中/ = $ g (乂 -歹) 2 • 
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证明： 只需证 


Es 2 =S 2 . 
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定理 2. 1 及定理 2. 2 告诉我们，在单纯随机抽样下，用 


歹估 F 


(Nyft Y ) 


这种估计的均方偏差 Var ( y ) = ^( l -^) S 2 . 这一估计是可用 


n 


的，且均方偏差有估计量 u (歹 




例 2. 2( 例 2. 1继续）对进入样本的20户，调査用于食品的 
月支出，得数据如下(单 位:元）： 
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这一估计的标准偏差的估计为 
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7 C . 
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6. 2( 元) 
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§3 区间估计与样本量的确定 


利用估计量 y 的近似分布，可对 F 做区间估计,其理论基础 
是下述 Wald-Wolfowitz 定理. 

im ^ 1 / 办 _ ^ \ 4^rt / ― _ — \ 7VT —1 O _ 日 7TTT 

AtU 王』•置 kSC\a N i ，-" fU NN f TM \^N1 ，"- ，丄 NN / ， i 、 — 丄，厶 ,••- 疋 

个实数序列的集合，满足:对 r =3,4, …及大的 N ， 有 




(<^ n ： — ) r 




/•"X / _i V 

uu ; 


(a 


a ； v ) 


d 


CLn 


TT / 

iV ， 


N 

/ , Um4 


N 


— X 

IN ^ 


ix 


nY 


N 


0 ( 1 ) 


— 2] — Xn ) 

"1 


^ N 


1 \ 

对每一 iV , ( X 1 ,-, X N ) 是取值为 ( x N1 , 


x NN ) 的排列的均匀分布随机向量.又记 


Ln 〉 y ^Nt ^ i 


则 


E(L N ) = Na N x N 


Vot-r r 

▼ UJL V 


一 一 rt 

rr 


N- 


•N 


A ， 

V 


Ni ^ N 




N 


V 


XNi — XN 


V 


且 


pi Ln — EjLtsi) 〈 


■> 


VvarCL^v 


m 

) 


s / Ztz 




e 


^ dt 


(N 


证昍倚 介.伙宙拥证昍由右细敏的卄笪_细节 WT 叁砉 A 

w * ，蟫 I w ^ x « I ^ p v , , ^ I • ，- ^ I— ^ — —' 
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Wald and J . Wolfowitz (1944 ) ， Statistical tests based on permuta - 

人: - — — —. ^ 1 二丄: \： 一一 署—丄 丄 — 丄:—丄 飞 F — 1 ’1广^ O r O O ^7 O 

nuns ui me ooservations fi\nn. iviaxn. oxanst. f voi 丄 o,pp. ooo 一 oil. 

此处简略地介绍证明步骤.首先正则化 U M }，{ x M }. 令 




^ Ni l— 


N 


N j 


Sg 


Ni 


a N ) 


T 


工 Ni 


工 Ni — 工 N 


N 


告？ 



Ni 








可证 Uk ，…， a ; } 和 { x^ ，…， / NN } 满足定理中的类似的条件. 
又（ X 彳 ，…， X ' N ) 是取值 Cz 4 ，…, x :) 的排列的均匀分布随机向 

l=t A 

重.令 

N 〆 


•T- 


则 


E ( U n ) = 0 


v N 


Ln _ E{Ln) 


yVarO^J \/Var(L 


N 


经细致计算可得，对整数 S , 


因此 


即 iV 


E { V N y =\ 


/ w v 

KZk) 

2 k k \ 


N k -\-n(N k ^i . 劣 ^ = 2b 

▲ ， I \ ▲ ， ， 7 j v ▼ 


< o ( N k ), 


当 s = 2 k + l 


E 



w 

Ln 


ar(U 

- - j ，- 


E 


^ 明冒 _■ , ^ 

L N — t,^L 


N 


'/VarU 

w - 、 - i ， 




v 


(2^)! 

2 k k \ 

0， 


当 s = 2 k 
当 s =2 k + l 


( N - 




时， [ L n - E ( L n ) WV ar ( L N ) 的 s 阶矩收敛到标准芷态 




404 




随机变量的 s 阶矩， d 此 [ l n -£( l n )wv ar a N ) ，有极限分布 

■ ， 

N ( 0 ， 1 ). 

利用此定理，把 {Yi ，… U 看成 U N1 ，… ，、 a NN } ， JV = 1，2,… 
序列中的一个，而 ― ° 

(工 ni ，…，工_ ) = (1 ，…，1，0，…， 0) 

' ~V~， * -V- / 

n N~n 

且券 =A >0 时，[歹 一 7WVar(y) 有近似分布 N(0,1). 又总体的 

1 N 

- —■ M m = _ • I m _ 暹 為 * . . • • 

四阶矩有界的话， 

viy )/ V { y )-^\ 

Hltl 厂一 1 r~\ / / / - ― \ X » 、 r^ /t\i / V -A-*' x t / r\ i 、 11 •’ /* 人 toa r^rt i 

mLy — ij / w ^ yj / j ^ Tam ^ yrw jvu ；, 丄入执 iiij 范疋亘 i 爾反丄 — a ， 


1 ■■_ ft * 办 W , * ft 参 •麝 ^ fw 裊 • • 蟲參 身 1 

口 J 査得你准正态分布的 1—f 分位数，有 



P { y - u f ^/ v ( y ) < Y^y + u f Vv(p ) 


(3. 1) 


即 [ y -“ fv / z ；( y ) ，歹 + u fv / u ( y )] 是 F 的置信度为 i - a 的区间 

估计. 


/Eil 1 -i / h^\ n i o n AtU^ A-f*. \ -fcH tffT tJ^ t \ t 1-^ Ardb Pp[ czi A=r t=t Xft _L/-» 

m o . 乙•丄、乙•乙 m ^ k ) 

合品 吉出的 0. 95 晉信摩 的冈间 估计.则杳出标准 TF 杰分布的 1_ 


分位数 M=1 . 96 . 


y-u^v(y) = 176. 6-(1. 96)(6. 2) = 164. 4( 元 ) 


y J ru^viy) = 1 ； 76. 6 + (1. 96)(6. 2) = 188. 8( 元 ) 


所求的 0.95 的置信度的置信区间为 n … z Qn 


屬 ■ fW «aT HI 

匕丄 吁，丄 OO, O J 


在设计抽样调査方案时，取多少个样本单元是一个重要问题 


样本量的大小与抽取样本的方法以及对估计量的精度要求密切相 




dOE 





关.利用正态分布，可粗略确定在单纯随机抽样下为保证估计 y 

、丄 ZTlI AA t±H TffT -T-m C ： 匕 /tA 44A 曰 - /-4 - AA t±H AA .Vi- 、 : 5 ： 

b 到一疋 trj 惯反安不饥商叼忏平里 • lair 里 trj 根皮叼您依，旭吊 

■ j 

有维对精度和相对精度两种. , 

人 it* ― • L in^yf - ■ 1 -* ■、▲ / A *—1 圓 * vl^-#-k > -w -rm^ / I . 、 I — I 鑫 ■ 蓦■ 鑫 /_|^ 'w ▼ —JT—> 

钯对稩皮安豕••箔疋稩皮 a 布里估 rr 重 j 勻具 m r 书 
I v — yl <^. u 县瞄机亦暑.坐妷 g 能女一宙的 蒈佶麻 i —/ v 下傀 

I 一 I 、<« • >f>w i^aix i/ u _±±i 7 — I v “、，、 nu I" 上 - »-*v .f?i- I >h — 认 * ki 、 

证 | y _7|< d ， 即要求 

p/ rr — v <r a\ = i — 

^ \ J 丄 4 J 丄 U 


根据 [ y —?], W ( 50 有近似分布 jv ( o ， i )， 从而得 


解得 



n = 



当 n 很大时，可简化为 

n 


(u f ) 2 S 2 
~~ d 2 — 


(3.2) 


(3.3) 


相对精度 要求： 给定相对精度/ I ，在置信度1 一 a 下，要求 


P 


-- T T 

yjzji 


/ =1 —a 


从而得 


2 


VV ( y ) =uf 


I / 

n{ 


r? \ 

l ~ N) s 


J 


解得 


n 


( u f ) 2 C 2 


h 2^j. iuf ya 


(3.4) 


4-4* - > ■ r^K I、 T \A / I . 上 L A ■ I — t — - IT Art * —■* AVt. _y /二 匕 

兵屮 U =： v ^ 定思评的艾并杀奴. i \ 很灭时，円间早一 A ， 取 





^ 2 r 2 

/ 


72 = 


h 2 


(3.5) 


• ddfi • 

丄 v 



以上的式子中的 S 2 和 C 2 实际上是未知数.因而要确定《，必 

。2 AA /dfcr im -i- //-* r4-» xO 0=1 —r* TTil — ^4 - ^fir 彳曰 /r^ /.、~t AA ACT m>b 

现 I tTJ 但， 3* cM 、 丄 TFT 吊木相 P 刀広农 Cl 守匕 1 IJ 奶石 1 咐 

的估计值. （ i ) 察往法 :若总 体过去曾被调査过，则采用过去的 s 2 

i、_ ^to # i ^ v r 麄 ■!- \ I - - » • 澹 _i ■一 ✓ • • 、 ， _■，_• ± ^ V, f _ #r - jl I \a > - i=^ ^ r 

驭 u 的怊 tr 但 tr 昇出《值. ui ) 顶査法 ：无作 一个怦不重衩少的 

调査.以此小额样本的 S 2 或 C 2 的估计值确定 n 值，然后再追加 
调査，使总的样本量为 


§ 4有放回 m>s 不等概抽样 


在前两节中，我们讨论的单纯随机柚样法对组成总体的各个 


单元一视同仁，各单元有均等的被抽中的机会，但实 P 生活 中東有 

㈡ 汰由么鱼县 々卜午 同 笔袖仿 的搭 jy 伽加 .伽 ^ 1由，弗们姿 

JU *、 n~ 扉 ~ / u I ^ 「％# vj |-^ V 祖 q W ^ 7 1^^ — • I 7 fi -I H 

望调査该镇居民的人均月食品支出，但调査以户为柚样单元，各户 

的人口数是不同的，人口多的户比人口少如户似乎应受到较大的 

« 


重视. 又如，调査某地区小麦产量，以乡作为抽样单元，但各乡拥 


有的麦地面积是不一样的.这就要求用不等概抽样，使各单元被 

• W 

抽中的概率正比于所拥有的人口数或麦地面积应是适宜的.这儿 


的人口数、麦地面积之类的量，我们称为规模测度. 


本节介绍一种最简单的不等概抽样 

> 鑫 ^ » _ t r U- i • V • . 

準止比于规犋测度）捆枰. 


有放回 pps (抽取概 


总体嗽 〜) = <〜 ，…，^丨的每一个单元除对应有指标量 
I 外，还对应有一规模测度 X t < 正整数），£=1，…， iV . 有放回 pps 
抽样的每 一 次抽取，各单元被抽中的概率尸:正比于 X ,.每 一 
次抽敢后放回被抽中的单元，再进行下一次抽取.具体的实现方 

JVA- ■ ^ 

拔,： 


(1) 累积和法 


• t 

令久=1；足 • 对{1，2, 


， X } 作有放回简单随机抽样.设抽 

* m 

\ 


中的 数为尺 ，则当 





尺 G {1， …， 兄} 时， Mi 进入 样本； 

4 

r% ^ ( 'ir I -t v I ^xr 、 rt_L 、斗 I J^4 ^4- 

Ktr \a! 丁丄 , ta 2 / ， m 2 33 ： 八忏平； 


羞 m J ■ I 身 Ik \ -獻 wtft 會 丨 

KeuA ^ i — hA N — 1 十1)，…， a 丨时，如迓入枰不. 

汾 一 七吐 rsiffl 热苗亩拔 /n ^4 妨 + 时 ^ mm^n v v -i- v. 

J4 tz\ mjs/ m _bj ^ t in =| 』， -tA. /、 ng ^ i/\ ，i h i 9 i i “l ， 

X x + X 2 + X 3 ，…，兄 + … + ，x 很麻烦. 

/ o \ 曰 I . 4-nt Jit Mil rte ，/ 

取人观佚冊戈広 

合 M = max ( X ， . … . 毎一^汝袖取从1,… . N 中随机取 

、 --\ —— 丄 , 7 一 — 』， / ■ " ^ ，—， pr ,/ ， — , ，- - - , , v-^BT ■ r — 

vt# ^ ▲ H %i ■> • •詹 ^v> IT 象 ■ ■ L 身參 一 《>>■▲■ 二土 V ^ 

一奴 a ; 冉独立地从1，…， M 中随机取一奴6•当 b ^ X a 时，则… 

i*Wii±r4it A 拔★龙 a<^ v rati tiiry/r^^ ^Pi*M i±r 如 11 屮舌有而 

队 JW 匿 XLL y v IT • >1=1 V， , WJ OHi w/u 十 vu 队 ； IW 匿 • >H ? *V^ 

满 n 个样本单元为止.这种抽取法，易见在一次抽取中，各 单元〜 


-Ui* 、斗 1 44A-X-> 厶為 ^ar x^t J— Hhl* -Ltn -IsUr ote 、, ^ i >-V £4« A-U -4- 

恨畑 1 r 进八忏平的慎竿刁丹观佚侧反肌 inrL. 込 rr 刀広泪衣 

了计笪累租和的庇 M. 伯瓰随机数的汝救楢加 T. 




例 灸1 一 村庄有 8 个果园，分别有果树 50,30,25,40,26, 

* 

AA . 90 .^ M 么 IM TP 卜 k 不里 M 通粉的挪农 . ffi 7 ^木里閉你送 f 

丄丄 y j/|V* / K^\ ■ ■ - i^u ， 4 >1、 IM |/|V MV |*rU—f— 7 -T/V v I /|、 |£_=i I |- I I —I— • 


果园编号 

1 

2 

3 

4 

5 

6 

7 ' 8 

规模测度 



25 

40 

26 

44 

20 35 


I * 

m 县 一 t-±m 拱湖 il 由冰 而任 Ayf — c：n 巨 KSfe 士 flJWrVrf , 乃 A 、= 

川取 /、天 iyvj / 义仏取 T-t*. ^ — ^irr rmvu y^ 、“， v / — 

(5，17), l < a <8, l <6<50 .因17<26,故第 5 号果园进人样本， 

_iL* Afir 人 J4A -Jr- M W* AtAt —"人 4*rt rt-L / , \ / n n n \ 

力乐 一， r 忏平平兀 . 丹取乐一 TWH 饥议介 J ， 1 守、 a , 〜二 ■ w，cw / ， 

l < a <& A < b < 50 . 闵37>25.故收汝无里元讲人榉本.苒取随 

， ■ ~^*| ^ r _ ■ w • — — ~一 ， w~^ ^ iBriT ^ ^ I ， ■丨 p _ _， w ^ w mm 

^ ■鑫 f 〆 ，、 / 八 — V >m .m -m mm ▲ i & # ^ jTK. m m 丨 i , - I _ "1 

机奴珂 U ，々）= Cb ， ii 5)， i ^^$8， i ^^\ b(h 囚丄8&44,取弟 t ) 亏 
里商进 A 送太_士笛一冬样太治 f 苗:而随如粉时彳 Z 7./ l 、= 

， i 、 ¥^=\ XVII r ~r^ y /v >iv —I it '~r* ~ r~ / u• i ^ ^t/k hma i/ u >w ，， j \ 於 7 v ， 

(2,23)，1<“<8，1<6<50.因23^30,故第 2 号果园进入样本， 

本络二人往士始 5 祕士县 Bh 雄 "Mr 祕杜击 
乃术二 I 1 卞，廿千夕 Li. 

定理 4.1 在有放回 pps 抽样下，若样本记为 

()i ^2，…，: y ”） 







样本单元％是总体虮 iV ) 的某一单元，其对应的抽取概率记为 

- • _ -I Hill 

p 2 ， z = l ， …， W . 则 


Y 么 

x DDS / i - 

n 口 pi 

是总体总数的无偏 估计. 其方差为 

1 1 = 1 

， 1 JL ' / V . \ 2 

其中 R 为 Y, 所对应的柚取概率 . 

， ， _ 丨 ， lr ，， W . ， ， rn^rnmam r 面 ^ V ■ W ^ V ^ V _ 

证明：令 z i = y T / p i , z = l， …， w 

则(2：1，…，^ «) 独立同分布 

p { z = y i / p l }= p i , i = i ， …， n 

故 


(4 A ) 


(4.2) 


n 


n 


喊 。 s )= E ( 士 


n 


^ E ( z { ) 


n 


VfY! ^ • PvWy 

a 」 


Var(V„„„) = Var f 丄 2 ： v 、=丄 Var( 2 ：」) 

- - " _■ - ■ - ■ r 甲 ■ H m ^ j v — ■ 

1 I 




n 


一 -rrr 7 

n ^ f^i 

N 2 

Vcir^^. i V ' — vV . 

▼ 一 / n ^ y Pi ▲ j - 


P l 证毕. 


定理 4. 2 在有放回 pps 抽样下， V ( f pps )& —个无偏估计 

^ 、， 

重刀 

^( y PPS )=-/ r -~ i ^ 序一 U “• 3) 

n\n xj i=l \yi / 

证明 ：考虑 A ， …，&是独立同分布样本.样本方差 



71 ——1 




是分布 


_ 


df)Q 


_ 



的方差 


P{Z=Yi/Pi } = Pi, i = 1，…， iV 



的无偏估计.故有本定理之结论. 证毕. 

例 4.2( 例 2.1 继续）拟调査该镇居 民人& 月食品支出.该 
镇居民总数为 130 Q 人.各户的人数可从户籍册获得.以正比于 


各户人数的抽取概率从345户中作有放回 pps 抽样，抽取20户作 
样本.得数据 如下： 


样单元号人教 



吉出 

- - ■ 

榉里元号 

人教 


榉里元号 

| w 9 _ ， ▼ 

人教 

142 

8 

2 

188 

15 

4 

163 

9 

4 

169 . 

16 

4 

142 

mm 

3 

165 

17 

4 

IfiS 

"W 

ii 

5 


18 

4 

146 

12 

3 

163 

19 

2 

178 

13 

6 

195 

20 

4 

228 

14 

3 

182 




专出 

- - ▼ 

160 

mm 

丄 9t) 

169 

167 

163 

190 


抽取 概率厂 正比于各户人数，也就是 P , = ( 该户人数 ）/( 总人 

数）.故该植月畲品吉出总教的估卄倌为 


n 




Y 


pps 


n 


Yjy i/f p 


1 


142 



163 


.2/1 300 4/1 300 


rj f r •八 r* a r\ / \ 

/ 丄 DUD. 



參 ## 


+ 


190 


4/1 300 


人均月食品支出的估计值为 


Y PP s/N- 71 ^ 42 = 55. 00( 元 ) 


1 300 


对应的标准偏差的估计值为 


n 


1 1 * y i 

N 2 n{n 一 1 ) i 


V 

T~ Ips 






410 














-20 • (55. 
= 3. 83( 兀） 



o 厂 /V J=t 4*1* 4 ■ 蜂 

9 o tt m m ^ 

> 


J 纛 a P _ 倉 I i yr \ ^ > 魏 冒、 .#. 身._、人 1 _ ■ 1 »• ■ A _ B ^. J 重 a _ i ■• • ■- > *_ _ P _ W #!_- #■■* 

右思评的早兀 Oj 果甘现右卞且小和又的于思佯，谷 f 
M 汰由的鱼完的蛑杜枋乇坧袵 . Wl 毎>芊啟汰由劢_此垤鱼薈铂 

藿 U *、 n - I M v ~ I ~^ w M v I '4 攀 -L- T^v / W ，■ M ， ,y 、 9 ^T ^ )LS *、 n I - . II ― | — ^ *-* ^LL 

成总的样本.这样的样本往往能较好地反映总体的情况，比直接 

u ti /女出 Rj & i：n Wt 址而66抹 ★亩 右伴志处 你 1如1*}苗本各 ra K & 杯 ： A 66 

rr I rui i/ii-nii JM4 wv i 丁， i 、今、 i-l* vj ^sh n _bl jz . ㈡ aja^ —t -/、 


平均身高，总体是全国的成年人.由于我国幅员辽阔，各地人的体 


相|古 丧 B m 高论 I 兴砂 iVt/bfc 么 I ： 、 MrAraAd >™? 古古七上1 

—卩 UZE 开， IIIJ 1 义八大于卩: M ^ TOIL ， T«T 土尚力哄 M TO 、 TO 力、 

* 

江流域、黄河流域、北方等几个子总体.在各个子总体内较之子总 
体之间人的体型差异要小得多.又如调査民众对某一问题的意 


见.将民众按其职、 Ik 分成国家干部、工人、农民、家庭主妇等等子 

— W — - r ~ ■w -w ^ 1 ~r — ■ ■ v , ^ r - f w ~ w ~ — ▼ — — ■― - w 1 ' -• ~w ~w ^ 


总体，则子总体内的意见也较为接近. k 样在各子总体中取一样 


太组成啟的榉本审能 砭盹益 汰的掊袢 . 汶紳#夂子啟汰中取一榉 

I ^ a *> ， P "* f ■ ■ p 一一_ ■嘩 ^ - if ^ • * • ■ ^ I I i 響 ■■論 ■ _ t—f * i f I K ， p I 


本组成总的样本的方法称为分层抽样，子总体称为层. 


设总体 


° U ( N ) = 赋 iV ' ) u … U 幫 IV , ) ， 


第 Z •层（子总 体)％ (凡）=化 
从每一层中抽取一样本 


,y 


NH - hN , = N 



yn ，… ^ ym t 9 i = l ，•••，是 

灸个层的样本合在一起组成总的样本.样本量《=& +…+〜.记 



\T 

iH 

N 






1= 命， 




4 餘 ". 


mrngmm 細 ^ 、.參 t f t # i jrrt X * j - »g»i # > I*, m L\A f ^ 一一 I 

疋埋 5 . 1 刍谷辰均是早纯_机怦不时 


, , k 

V c = WvV , 
2 = 1 

M V iWiW 白杜斗甘你七伯若斗 

jhz ▲ mv >^u i/nq im ’ I • ；^n j4 ym^ny^ 

■ * 


(5.1) 


VCv .)= Vw ? —( l -^) s ^ (5.2) 

trf ^ Wi v iv, •厂‘ 

证明：由于 ’ 

1 k N t k k 

\? 丄 \ 、 \ 1 Tr 1 \ 飞 X T t? \ 飞 TTT T? 

1 = ^ AjAj i ^= J ^ Aj 1X1 ^^ = 令… 

I 

' 

故立即可得定理之结论. 

证毕. 

嫌 

定理 S.2 当各层均是单纯随机样本时， V(h) 的一个无偏 

•> • 

估计量为 



(5.3) 


、- r* nrt nit 0 9 上 a* —r* /*-*-* / t- 、 f 丄 L ■i n 、二 /^-t^ 、人 

nt 明：囚 5 『定 y 的兀 獨伯 rr ， 取:仴疋埋乙箱化 • 

r 丄 I • 

分层抽样时，样本量的分配是需要考虑的.即给定总的样本 
量 w， 如何分配给各个层，定出层的样本量 《,•. 下面介绍几种分配 
方法. 

a ) 等额分配.即每一层取样本量〜这样分配样本量 



主要是为了管理方便.如每一层由一个调査员负责.则等额分配 

»^ L A-t- A-* 、Cct 一 a 上 L —I~- n B. -FTL. 

忤+ 仗合调宜贝的丄伴里一玖 • 

(2) 按比例分配.即取 



这种分配法使各层中的单元进入样本的概率相同.此时估计量 


:V 


!> 


ty 


-- ; 


yij 


即是全部样本单元的简单平均.这样的样本在进行数据分析 
时常使处理大为简化. 

k 

(3) 奈曼最优分配.考虑〃 ^的分配，使估计量的均方偏 

1=1 

左 

J = 1 I ， 

达到最小.用数学分析中解条件极值的方法，可求得 



(5^4) 


实际求出％必须知道5,间的比例.一般多采用察往法或预査法 

■ 

-Hr* yfrt n »Vrt 、 r^ /ivt t /c\l 

犾侍 a 网的; mi 以 mwj . 

芬臣抽疰的日沾县提宫估 i + 的辖 麽知古 佰咎曲伽加女全 

/嘁礞 MH I I P-* ^ »—■ »-• V XSW ^4^ II—I ,1 !-• V I ri ■ I n ^ -J _L— 


国范围抽样时，以每个省为一层.层与行政区划一致将扱有利 

;!•} 面 :zfe66 々 l=l4tl 妳 ifflTXfc 斗彳；古访宜 66 牲 FfiP Rlilrlr/ 由次 : 
J ：BL 日杜丄 I 卜 • yv J IX- 114 ^1 "hi -tx. |RJ My TR Z3C ， WJ /J!L l5Cl=r 


层内的单元比较匀一.这一点可以从下面的例 5. 1中明显地看 

■ 11 ^fr 

田木 * 


俐 5.1 下丟县 1984 年我固女陆除而藏白治 反外 28 个者市 

w _ w 9 ^— — ， v ， . p • ， ^ I __， ■，才 ▼ ■冒 •/ - ，^ r 1 « »— 1 ， ■ 圆 " 丨 _ , p — — v p • ' | w 

自治区的工业产值(亿 元）： 


4i3 



246. 07 
204. 26 
184.95 


167.43 
133.36 
126. 70 

90 71 


8 

104. 38 

- 15 

63. 93 

9 

100.86 

16 

63. 10 

10 

98. 30 

17 

60. 17 

11 

96. 66 

18 

45. 62 

12 

87. 59 

19 

39. 22 

13 

75.84 

20 

37. 77 

1 A 

7 Q ^9 

91 

Q 7 1 » 


22 36.54 

23 34.27 

24 31.39 


28. 41 


丨 2 7 


98 


6.23 

R Q.R 


假定从 28 个省市自治区中抽取 12 个作为样本，来估计全国 
土业总 产值. 

(1) 若直接从28个省市自治区中用单纯随机抽样取12个样 
单元.则估计为 f SE = JV 5 T . 其均方偏差由§2知 


vcy , 


从上表的28个数据可算出 


N H 


S 2 


故可得均方偏差 




_^_ 2(^-^=3 721.00 


V ( Y se ) = (28) 2 古 (1 —挂 )(3 721.00) = 138 917. 33 

.(2) 若将28个省市自治区分为两层，产值较大的前14个 
为第一层，产值较小的后14个为第二层.按比例分配样本量. 
从第一层用单纯随机抽样取6个样单元.从第二层用单纯随机 

柚榉取6个榉里元._全困丁#啟产侑的分层估计的均方偏差 


为 


.V(Ny sf )=i]N 2 ^ 士 (1 - 彔 ) Sf 


现在 k = 2 , W x 


14 




tWi = w 2 =6,从前面表中的28个 


数据可算出 S ?=2 696. 72, 氏 =327. 61•故 
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V ( Ny st ) = my\Y - \ - (1-^)(2 696.72) 

i w ^ V \ ▲ A / 

、 

/ H - i (^ n ) (327 * 61) ； 

響 

= 56 454. 16 

* 

* 

较 （ l ) 中之值小. 

(3) 若采用奈曼最优分配.在 (2) 中的两个 M 中作分层抽样， 
则理想的样本量分配为 



WiS , 

A A M w 


=12 




( 丄 \ AV I 

IT 尸丄 . y )t 


( -L \ v 

IT 严丄) 



_ w 2 s 2 

. n 2 ~ rt W ^ s 7 ^ w \ S 2 ~° 

I 、上 J4A -i- 曰 - tA- 人 O r-4-t /X- Ai4 Xttii 4>rt 40« 444 Mtl 人 M -nr- .H. ^4 H =： AUt 

仪工 Mi 忏平里仕門/「伝 T T P 平 54 i wa 似 L 畑忏， 3 WJ 王困丄 1 屈、厂但 trj 

估计的均方偏差为 

( 28)2 [(+)(+)d)( 2 696 . 72 ) 

十⑴⑽-咅)( 327 . 61 ):. 

= 37 791.80 ; 


§6二阶抽样 


一略油择沛二阶如略址择女+荆的命 G 彳苗本丁你出且普田 

― -VJ\ JW IT^A 4 — IVI 1 rvi JW IT M - 八 「， J 、 歹 "J _BL _ L - ■广 I rp / |J 

的方法.例如要调查某省农户的某些指标 * 则各农户即为最小单 

二 /口人/上>士 占 */r 甚 H 口 々士土士 iU 由 rtlF ；* 4始勒妳 m 
JU . |±± 土旧仏厂 JIA 里/ V 八，±±订你厂卩 y T = l 禾！ M /7 I 江夕供手目，四 

而若直接以农户为抽取单元无现成的抽样框可以利用.这时可采 

trl —- it 人 44A 40* J4A 八 ―17 人 irn_ ,,、斗 Z 一 - 」 t4- AU 、 f 办人 /L、Adb /A C3 /X- 

用 — 机烟忏. 畑忏 OT + K /「 权进 TT . 目兀付王苷的夕 mSWYTP 乃 

笛一件柚榉里元.弁令省中诜宙若干个乡作为第一袢榉太里元： 


• _ ■ ，I 


« ■ — 


■ _ ， 


然后再在被抽中的乡中将农户编号作为第二性抽样单元，选取若 

• 415 • 


干农户为第二性样本单元，调查它们的数量指标.采用二阶抽样 

/士 AA j-i-* r^t jB=t 山 -T^ 卞 人 tEJ ^J=l 士 A ? 人 /L 、 -H±* F=F4 AUt l«r 4*rt -UU -PA nfc* 

lx 饭两 ®rtrjHx 厂采 1 r 丁石丁歹，四 iiij 权王苷犯臣 itrjwaiyLiw 忏，书 


便于管理、省力、省钱等优点.但由于被调査的农户集中于若干个 

. #• 

/ 

少 ‘ ^1 ^ If I ■■ ■*' ■ 、■身 » 1 rt a 八 _ r ^ \ - . » . ^ \^ a—# p #. 、奢 - t — t I —• 八 、 i • 上 l t—t 一 r _^ 

芕 〒，囚 TO 彐冋一个芕円乙农尸问的差并小卞芕 Z ： 问的差并叮，— 
阶垤太太加合劣苗固的哺和垤金右伴志杜 

I/! I I r ， I ■ -JL-. 口 m v r^tt 1 / u it n i v 今、 i 」一 • 

二阶抽样问题的提法如下 ：总体 


■ V ^ *m. w i 1 i ■ _ ^ *m v 、 

u uq i \) = u uu \ i ) \j … U 川 k ) 


NH - hN ^ -N 


• 磚 ， y* I *g . L t _ L\A > A — _ k . „■ 、 t A A-A** t #| ^ L t- L、A 

%( j\ f ;，z = 丄，…，々刀弟一彺捆忤 早兀. 七令 八, T 罘一彺畑忤 

/ 

单元 


^ U ( N { )={ Ya > ••• ♦ Yj 3 v ( } 9 i = 1 ，…，是 


k % _ 

调査的总目标仍是总体的总和 y=S S y o - 或总体的平均值歹 = 

t =1 j = i 

N. 

Y/JV 等等.它们是各个第一性抽样单元的目标量 K = 的和 

• _ ， 

7 = 1 

或兄 的线性组合.我们可一般地将调査的总目标量记为 G ， 各第 
一性抽样单元对应的目标量记为 G,，t = l , …， / L 不妨假定 G = 
G + … + G . 因为第一性单元在第一阶段抽样中均有可能被抽 
中，所以对每个第一性单元拟定一个组内抽样计划，并选定目标量 

G , 的估计量.给以话当的记号列于下表： 

_ » w w * p 墨 • t 酽 ’ r - - ，丨 -^ — 


第一性单元 

° U(N 山 

…， ^( N k ) 

第一性目标量 

G l 

…， G k 

1 •, 1 —j # # 詹 ■麄 • _ - m A ■__ _ 

拟足的弟二阶段 

的组内抽样法 

方法1 

••• ? 方法々 

Gi 的估计量 

gl » 

mu 

» gk 

g , 的均方偏差 

a \. 

…， o \ 


o \ 的估计量 a \ , …， a \ 


此外，还需选定第一阶段的柚样法.常用的有 （ D 单纯随机抽样， 

^ w w ^ w •— ■ w ^ ■ _ — - ▼ ■ v v ■ « - ▼ ■■■▼_ ， ▼▼胃 ， w v p -^― ' , — ^― —' — ▼，一 — — 

( ii ) 有放回 pps 抽样.对每一个抽中的第一性单元，按拟定的组内 




抽样法抽取第二性单元做调查，算出 A ，以它们为基础估计 G， 并 

nr )丄 m. a a - la » / t *» - v ^ 

WT 九 1GTT 里叨巧刀谓左 • 

定理 6.1 当第一阶段采用单纯随机抽样，从 K 个第一性单 

— ■: r t ^ l I, -nl* t A ■ r - 丄 l I — t T*n ta 八 r-t _L*\t 上 1 - a»-» / t. 、 t B. 

兀甲捆取 々 T . 捆屮的亏俜定 A ，•••，&• 丑似疋的组 ㈧ 伯订里& 
嫌 ffi • FY 0 * 、、 =/ T ? . 7=1 • … •▲. Iflll 

1 / • — X ^5 l X i 7 ^^ I X l 7 — ‘7 7 - ^ 

⑴ A = 会2]心， （6. 1 ) 

»C 1 . Hi 

.' 1=1 

是 G 的无偏估计量. 


— ▲赢 k » %k. A %h 4k. 鳳 l 

( 2 ) G 5 的均方偏差为 


T 广 1 

A 


v ( G 》= t 卜 


务) [占§卜 f ) 2 ]+ f 》” u ) 


V ▲ V <W V V _#. # Jl ■ • ^mJLm # 丨 ^ f _ • 、數 

C 3 ) VCk ) 的一个尤偏恬 tT 重刀 


v(G s ) 


TT^*). / J v 

J \~ /-, 尺 ’ 




1- 


J v f- 1 是 / 1 -^― 


\ 厶 幽 1 






T 



( 6 ^ 3 ) 


证明： 抽得之组号久，…，氏是随机变量.但对任何抽定之组 

号， g 0' ，…， 是相互独立的估计量.我们用表示在 A ，…， 

仏取定的条件下的数学期望.有 

E(g e \d)=G e . , 


E(g\ \d)—a\ +GJ. , z = l ， … ，是 
ECge.ge. \ ❽） =G ei G e ， i 竽 j ， i,j = l, 


•擊肇 


I t 

/yuiu 


k 

( 1 ) E(G S ) =ElECG s \dn=E[^^2G 6： ^ 


) = T 1 

^ t =： 1 K 

7 上 r A in 

t=i 匕尸 i -■ 


k 


K 

k 


2 「 2 GjP {d t = j} 


477 





(2) E(G 2 S ) =E[E(G 2 S |^)] * 


E 


E 


K 

~k 

t 


k 


^Eig^ld) + ^^E(g di g ej \d) 


k 


2 + G \ ) + 2 

J = 1 ' i^j 


K 

~k 


k 


k 




+ X ；2>( qG ，) 


而 


^E((T 2 ei )=^^ t (jjP{di=j}=^^ l (T 2 j 

j —7 1 £ —1 j —?■ 1 ^ —— 1 


k 


k K 


: — 1 _1 *_1 -XV _1 


K 


K K 


2 2 e 2 2 2 { 6i = l ^ dj = m } 




m 


k(k-l) 


K K 


T^r / t ， 

/ V 、/ V 


■ - I 1 

l^m 


m 


故 

E(G 2 S ) 




K 

k 


K 


2 4 + 喜 2 巧 + 


k(Jz — 1) 


k 

Kier，. K^r 3 * k(k-i) 


K K 


S 




K 


fE 


+ 


k 


1- 




k-1 


K 


+剧炉) 


K 

k 


V. 2 4 - f 互 、 「h -i=iU Vr,? — 塋、 

1 \ U \ \ ■ 1C —— 1 M — 】 ~~ 


\k )IV K-l/\fri 


K) 



( 


k-1 

T ， 1 I T ， 
/V — 1 J\ 


( l - 


k-l 

'LT A 

XV — 1 


/ / 


K ^ . K 2 /. k \ 1 A /广 


G \ 2 , 
K) 


m 
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所以 


V(G S )=E(G 2 S )-G 2 


K 


2 ， K {l _^ 


K 


k 




— m ^'w -r ■ —— 

k \ A/K — 





有 


E(g 2 e )=E[E(^ \d)^ = Elal +«] 

i t t t 


IT 


IT 






E(ai)=ElE(al \d)^E( ( jl t ) = ^^ 


从而 


k 


E 


k 




-1 




k 


Q 


^ ~ kE \~ k^ ge i 


k-l 


^E(gl)-^jE(G 2 s ) 


K 



所以 



£： CKG 5 )] = f 

/c \ x y _2 \ 

+ i&l+f 「 洛 1 

iV / = 1 


2 


x 


k /- k \ i r r \ 



I 

十 


fC 一 k 




A 

\ V ~^ O. 

)^ 


K /-. k \ 1 / G \ 2 , K o 

k{ L ~K)K^i^-K) 十 


G\ 




V(G S ) 


w 泰 _ • ▲ 

证毕 • 

定理 6.2 当第一阶段釆用有放回 pps 抽样，抽中的号码为 
❻ I ， … ，艮，对应的抽取概率分别为 ，…， Pe k . 且拟定的组内估计 
量仏 满足: E (仏） = G , “ == 1，…， K •则 


( 1 ) G 


pps 


7^1 r 6 


( 6 . 4 ) 


是 G 的无偏估计量. 

(2) (5 pps 的均方偏差为 


V(G PPS ) 


齒 +i ㈣ - 


fa o 


( 3 ) v ((5 pps ) 的一个无偏估计量为 




pps 


((\ ^ 


■5 TT 


口 n 人 

m ： 


7 _ — / 

^ i—gd / 



，…， k 


由于抽样是有放回 pps 抽样，故 d ' ，…， d k 相互独立同分布.从而 

r~F r-F V 丄 、- i—r 

乙1 ，… ，厶 k 烛义，丑 

E(Z t ^E(|l)=E[E(|i|,)] = E[^,] 
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pi Pi 


Var (乙） = ECZh - CEZ ,) 2 


EE 


ge. 


-Q 


E (^7)(4 + Gg ) — G 2 


因而有 


/ i \ \ 

V 丄 7 IL \ LXpp S ) 


e / 


• / 1 \ 2 . . 

2 J ( i -) (4+ q ) •尸) 

7^1 ' ㈠ ， 

k 2 JL m 

E 羚 + E 铲 

j = 1 r j ^ = i r) 

K 9 K . ^ 

7 = 1 r i i = l XJr J ' 


— G d 


k 


Z ^ E ( Z { ) 




i * i •点 

(2) V ( G pps ) = Var (士习 Z 十表习 Var ( Z :) 


±^\± p } &-o 

* _ II# #V ■ _ 1 \ -* « 


2 


k 


(3) 由于厶，“•，厶独立同方差、故 r ^ T；S (乙 一 Z ) 2 是 


，， / 产 ， v f # . ■■■■• imXm / I. 、 r rtM \ \ 飞 / 0 ^ \ i^t 

VaUZ z ) 的％ 懈佰 订，即 ^^2^(#— G PPS> (是 

〜 A i=i ^ e , 


2 


Var ( z > Lgp y (K 

上 L 1 "* / I ^ \ I 丨 t 層 f _1— . 邋 、 ▲ ■ rri ^ - / _L- 、 A ✓八 v \ 

的兀堀佰 rr . 从 fm 句疋埋 z : 珀汜 u ). 址 半. 

伽 6 1 前面你 U 1由， 個本樓讨中永里焓产暑甚求田一阶 

^ 驅 IX -4 丄 • — | ， • 厂 4 W^\ % ^ /_!— 、，|、/ • ^b-4 ，■、，■— * IX I 

抽样.第一性单元为果园.第二性单元为单棵果树.第一阶段用 


、一 ■— Ll>* 

Ut 半. 
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正比于果园果树棵数的概率作有放回 pps 抽样，取三个第一性样 

M —^ -UU 山 A “ 口 m -ll_* / r- /» n \ Me —- IT 人 C/t- 匕 -UU 山 A A* FFT P=1 山 Hd 

平兀 • 烟十 1 入乐一 b /「 权仕母一畑十 • 的术四門用 

单纯随机抽样取5棵果树作第二性样单元.得资料如下.该村果 

，一 . >/. t >TTi vP/ ■ v. a — 咸 t inrt 

柯思棵数刀 Z 70 侏. 


i 

二号果园 

五号果园 

六号果园 

拥有果树棵数 

30棵 

26棵 

44棵 


638 

560 

800 

榉太倌 

膠 _ ■ K* ■■ 

605 

610 

476 


/lb 

/\ r~\ j 

oy 4 


(单棵果树产量） 

535 

857 

753 


568 

515 

622 

平 均值歹 

612.4 

647.2 

652.8 

方差 S 2 

4 851.3 

18 167. 7 

16 374.7 

记第 f 号果园为 

0ll(N^ = iY, 

L 7 7 — uy / 


当第汉果园被抽中，从中抽出的第二性单元记为 
则本例第二阶段采用单纯随机抽样，故 


gi=N,y,=—2Jyi, 

； = i 




N i 


是&=1=^]1^ 的无偏 估计. 对应的均方偏差的无偏估计量 


《=丄(卜畀 W 

71 { \ i\ ,• / 

从而根据定理 6. 2,该村水果总产量+… + Y S 的估计值为 


▲ 


Upps 


k 


^ — 

_ 1「 

P , 一 

— 3 L 


(30)(612.4) , (26)(647.2) 


(30/270) 



(26/270) 



(44)(652,8) 

(44/270) 


172 116( kg ) 


对应的均方偏差的估计值为 




A 97 
















( G p?s ) 



K 是 一1) 




W V « mm V 

k、k — L ) 


魏）-砍 


3 X 2 



/ y-\ X ，八 1 A X 

UUJlt) 丄 Z. 

~~30/270 



/ r% X y r% a ' 

(, zbnb 4/, z ; 

^26/270~~ 




(44)(652. 


44/270 



— 3 • 


(172 116) 2 

彆 


=11 641 968 
标准偏差的估计值为 


VzK^pps) =3 412(kg) 


§ 7 基千超总体槙型的方法 

'W r , w 'W , _ ▼ ^ ^ ■— 

前面几节扼要地介绍了传统的柚样调杳的理论.它县考虑固 

W ~W W ， , - W -W" ， , w~W ~W , ^ - ^ , ▼ *w ^ V - ， - - V 丨 -鑫 ,, — II !■■■■■ ， WP 1 ~W - # —- ▼ 

定的有限总体，总体的各单元的指标量是固定的、未知的.统计推 
断的基础是由总体中按抽样设计抽取样本单元所形成的随机化分 
布.这种方法也称为基于设计的统计推断方法.讨论抽样调查理 
论问题的另一种方法是基于模型的方法.即考虑现实的有限总体 
“"•••，^}是随机.向量（1,"*，^的一个实现，这个（1，"-， 
Y / V ) 叫做超总体，其分布函数为 FC & ，…， : r N ). 由抽样设计抽样 
观测这个随机向量的若干分量(:^，…，％)作为样本.利用此样本 

N N 

对春 Sl 或 Y = I ] Y « 等作出 预测. 分布 FU ,…，以称为 

i=l i=l 

超总体分布. 

为什么要引进超总体分布？大致有下列几种解释. 

/ 1 、 rra ^ /-X^ /jl- ■ 人 i . 上 l ju juk aa 九上 ^ 上 l 人 l\a _i_ -wn 

U ； 仴 PR 尨件 PJTP 刀一热思件的一 T 忤夺头现•例 
加.对一片榭牀锢吝材箱骨.毎摁榭都 WT 看作县一宙白妖钚揸由出 

| ^ 丨 I ▼，鳍 K-# I ，聲 豸 r»i ， ^ p-^i i i / «—p v i 、、 ， i i — 

长的此种树的一个样本实现.超总体分布就是这一环境中生长的 



树的材积的可能分布. 


/ 


/ 、 +tt XL /-X - 八 -At- f=i 4-14 -、上 -rtn m A a* -fcf* n* 丄 rt -rtn 上 A* -kttr -mi 丄 " 

、 ㈠ 祖思件仰定佃比现头 is 开 mi 禾 wwatu * 现豕旳保型 • m 

经济学、社会学中就经常为一些现象建立一些研究的模型. 


(3) 从災旰斯玩 tr 的观点，趙思体分帀钣考思刀无验 分布. 

胡 ㈡ 饮 傲刑且轴断學丁 a j 由 a 们能亩冻伽 Wi 了做 > 

\ 鬈， /v&JLii 、 n~ ，i I -^r~ 7 i^. /、 || j 卩 u \y^i -4 y»rr 

些理论结果.例如可研究在一些确定的模型下，某些估计的最优 

A4* 绝 iVH 丽 
I 工寸鬥奶 . 

(5) 超总体模型是研究抽样调查中非抽样误差的一个得力 

- JL * ：^r • 

汶里我们卩简胳地讨论一种很简里 的捲型 ，诵讨它介绍一胜 

■ W — ■*■■■!* ， ， • ■ ， ， ， ■■ ， • ▼ ， ， ▼ 1 9 ， _ r -， I • ， ▼ ▼ •/ 、 W 、 mm - .■晒 • ， V ， •"w ■- ■ * 

有关基于模型的推断的基本概念. 


我们假定 I 


，…？ 


独立，有相同的期望 P 和方差按某 


种抽样设计观测的样本:^，”•，:^是它们中的 n 个！^ ，…， Y en . 若 
抽样是单纯随机抽样，我们用 


g ( y ' 


^ y n ) 


n 


来预测… +1 V ). 这一预测满足 


- k AgaA k Ut _jfc. * Ik _ 烏 - —- - 

CD 设计无偏性.即 


K ( 


n 



. n N . 

iw Vv . 丄、 


\T 


J — L 


# I . - 1 , y 、 —9-^ — \ —# L 、 rt 、 耋 _ tT/ ^Jtx. X.JU / 八 /\ v tr^ 丄 rt tt ^ /A /r^ 4+rt 士 M 

共肀 m • 』衣汛对议 rr 形成的 Wi ， …， 陬 mmor 仲取 朋笙. 


( 2 ^ 港刑子偏杜刖 

\ _ ， I /、 ~1~". ， « KI>V I— 


i ( y ~ Y \ d )=0 


甘 tb 义， • 、主 e7rf：te tt/irZVifcr CVt ... ^ % 別 • 

^ w I' ^ V 胃 / >PC4I^ ACId J4 x ' V^l 9 9-^N y H^^9Q HU ^ v ' u/ 

就县取宙 <9=(/9, ，…，义）的备件下，对▽一？的分布取期望. 

『^»r ^ 胃 '—A, ▼ mj jr ' w 广 ， ■ ■ 

e 

(3) 模型设计无偏性.即 

• A A m 




iE(y-Y) = 0 


r v I — vjg >n»t ^ t _ l _ 、n 上 l\/^ r v » 

vx y mmi y ，兵顶测的误走以 


« 




iEiy-Y) 2 


%. % ■> 


釆衝量，它钣称之为预期均方偏差，顶期均方偏差小的估计为优. 

m J 7 r ^ — V ^ 2 命院卜且右 KH 木北存 T 3 S 66 知 ±fr 2^4 ^ Tf；r — 歹、 2 丨/)1时 

^ ^ \^y m y r/g>_u*>c, r^.riv i w ;;，i h ，队 r=q ^i_ \j ^： ▲ /• i v」/vj 

每个 0 均存在时，两个期望运算可交换次序.另外，为了记号的简 

■\ ' . »; ， • * ； - 一 . . 

洛 ★ 始知牲 》ll 如匕丫 士 ■Wrirt / “ 」 \ 一 /\^ •一 心 、、 TTT >fcir -fa 

似 ，IX BU 松饮组 IR/t r ， ’I 、 W 叹， … ， 3^1 7 — v I 1，…， i n 八 H J 升付 

LU V 预涮 7 的雨助崁古偏巷 ,； ' ：( ’ 

v ， 嘩 — ^0 、,，鏽 T ^ r__v ^ JL- 


_ \ _ 

〆 mmmmm ^ v . O — I 

-Yr^^y -Yr \d] 
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Ei 
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」(★-忐) E ( Y 「"）, 
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rt+l 
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m 丨 

TV 


N 


) y ^ uY i - u ) 2 \ d ) 

I ■ € .rf ► 



(ir?\ ^1 i{ (Yi — u) 2 I 6} 

1 \ V 。 

- m ) ^ 

▲ ' f 


_「 / 1 
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/ 丄 i 

l^l 

\ 乂 ，/ 


V ， ■ V V 

(^N — n)a 




一 f I 


nY 


\XL > K- . . I* \-T- l-trr j 一 • 、 tv -n^>l ■-* — ca ^~r 上 L I ->J- Xl^> f 1 _* 、- / 山 、*▲ 上 L /*1X 

边:一步 nj 址明 ：仕 X 还悮型定 r 网显小顶 朋叼 力调走的玫 

性的模型无偏预测.这是由于对任意一个线性预测 


g = a x yi H - \- a n y n 


有 


SE(g-Y) 2 







a t -^； + N 


N 


N 


a 


而由模型无偏性，有 


A 9 R 

x w v 







n 


n 


fjL= z <^(g\6) = ^ a i iCy i |(9)= 2 a */ t 


n 


故 （ a ! ，… ， a „) 必满足制约 = 1. 易证在此制约下，当 a t 


n 


t 


-l 


， n 时， 


/ 


! ai ~ h ) 


nw 曰丄 Afc 4^ — v， a T? au 曰丄 

取取， j 、 ia . a>L y m ^ trj 取 / j 、 iw 朋 


均方偏差的线性的模型无偏 预测. 同时也可证明歹是 F 的最小预 
期均方偏差的线性的设计无偏预测，这是因为 


n 


n 


n 


Eg=E2^a i y i = E2Ja i Y ei = 2Jta t EY &i 

i = 2 i = l i = l 

f —^ " /\ /\ \ / \ » - f 


n 


设计无偏性同样导致制约 Y!a 


1. 




-i XK U\ T »Uk rrl WvAr Xrt HALp H A4 /-r*^ 4Jt 4»i* 士 ^ If vHt >-4-t 1 1 1 

i. «— 平？ r 衍于 兴 . 們 /tiwa 饥奴衣， tf 平？ nwa 饥烟忏， / 于升 t 畑中 

20页，计数各页的单词数，从而对该字典的单词总数作出估计. 

o rCil m Biff 1 AA -IV i±T >ttt M ^=! M 4U* AA fi& / 士 出止八 nr AA r^T to -)丄 T7 

々 ij/tj 郷丄 tPJWivs ，小于开平 wj ^&5®c tiy 废 i 曰 戊 >/y ny l i o j 1 口 h • 入 

若希望以 0. 95 的置信度保证估计的相对精度/1 = 0,_，10,你认为需要抽取多 

i 

/K l?r /4r -Jr- O 

7 J^TFVV 忏午： 

3. 成数估 计:若 总体呶 AO 的单元分为两类.一类拥有性质 A ， 另一类 

不具有性质 A . 现要调査总体中具有性质 A 的单元的成数 P (百分率).可令 

# 

„ 丨1，单元叫具有性质 A 、， ^ _ 

Y ( = ( i = 1 ，…， N 

10,单元％不具有性质 A ， 


则 p = f =4 2 y «- 对此种情形列出单纯随机抽样下， p 的估计、相应的均 

1 = 1 

— /A -V^ TT _L 上 * —X- -V^ JL “ £JU > I JmM* - =*=f 、- L —U /ill X3JL -U. n IjK Pd A 上 “ A4 /./« 1-1^ 

刀獨左汉巧刀獨左 IfJ 怕 TTITJ 衣込 : AA 以忏平卞 • 兵乍 仕 ; 贝 /i IfJ 平兀 tTJW 双 P 

I 

表示）. 


■ 


4. 从有16 238户的一个城区中，抽选300户的一个单纯髄机样本，调査 

426 • 








该户人均住房面积是否低于 6 m 2 . 得到人均住房面积低于6 m 2 的户数为 
109. 请估计这一区中人均住房面积低于 6 m 2 户的百分数，并给出相应的标 
准偏差的估计. 

谝本宜市居昆歡伍由地 M 的 善菸蜜 樓市苗昆白啟粉呶 "2 70 S 汾 4 fi 

^ w v' Ir_ , ■ 、 • , 1—4 fNJ ' i/u tx w r-v ^ f=i 1 • , ,， f I fNi / / V — ，一 ^ 冒麵， 

户.粗估普及率为 P 。=30%. 若希望以 0.90 的置信度保证调査后的普及率 
的估计误差不超过3%,问进行单纯随机抽样应取多少户作样本？ 

6. 从一个有限总体中抽取一个样本量为 m 的单纯随机样本，再从这 m 
个样单元中抽取样本量为„(00的单纯随机样本.证明所得的样本量为 n 
的样本是原有限总体的一个单纯随机样本. 

7. 一乡调査在楝小学生中途辍学的人、数，以学校作为调査 单元. 该乡 

* * m t - 

: it 右儿坐10靳.啓沿的女坊 II . 査浙刺 子下类 . ，，，/ 

，、 ■ _ _ 嘩 一 w /， I 7 ■却 _ ^ 〆 W j=3B.l>w 於 4 螃 I r m ,r 、： 


發坊迪县 

1 

[ - 2 '. 

• 

A ^ 

禱 ' 

5. 

t 1 

a - 

7 , 

f 

.•只 

f 

p / 

Q 

in 

丄 w 

'W , 罨 

詹 ft ^ _ ft _ _ mMM9 

在衩儿重奴 

102 

< 


34 

89 

134 

' 1 

86 

~ i- 

91 

45 

• ^ 

73 

i 

55 


试用累积和法及最大规模 •测度法作杈 率正比 ¥ 在校儿'童数的有放回 pps A 
样. 取样本量 n =4. 

8. 若题 7 中作有放回 pps 抽样，抽中的四不样单元是 1,4,7,8 号. 调查 

坧禾卯 r : 


学校编号 

V 

1 

4 , 

, ! 

7 

， * * - 

( A 

e. * . — 

辍学人数 

7 

4 

9 

3 


、 €# _^ 暴 1 ■■警 • _»^霡 - ■ 9 ■ . 、 I A WF , • 、/■ • r I 二 I I J W . A -L 

w 利用 j ： 夕 u 奴诟估 tr 芏芕小字生拔字的思人奴，开豕 m 和应 的怀氓 ■差的 

* t 1 * 

估计. 






9. 证明有放回 DDS 不等概抽样的估计的方# 有男一十表达 

- ， ， ■ r ， -w » - ▲在 w ▼ ▼ ' w ■» ■■ - ■ ▼ 9 W~~W • W V V iLf - ■ -w - 广 V» — *■ ， — - ■ 


—IX 

A 

T "C , 、 1 /Y t Y } \ 2 

10, 诳明 §5 .中分层抽样样本量奈曼最优分配的结论.」 ） 
n . 下面的数据列出 一 个地区所有农场按规禊大小分层的五+层，以及 
每个层内各农场播种水稻的>均面积.假定作样本量为100的分层单纯随 
机抽样.请算出 （1) 等额分配》 (2) 按比例 分配； （幻奈曼最优分配时，每层的 
















样本量以及相应的分层锫计的均方偏差 • 


•: T , ■ s . ^ JJJ - ， ） 

” m * • • 

1 

丄 1 

2 

j n 

O 

a i 

Ht 1 

' - c , 

O ; 

农场数 

394 

461 

334 

113 

,148. 

平均水稻面积 

w "W -W »■ r- » ■ v ▼ • 1 

w 1 

5.4 

- 16.3 

34.5 

50. 1 ' ， 

' 63.8 

>:. 标推差 A 

I ^ \ 1 

， 8,3 

13.5 

* 4 

19.8 

/ 

26. 0 ^ 

*• t 

35.2 

j > 


12. 一总体分:成 两层. Wy 和艮的值離下：: 


层号 、 

1 ;： '. ， 2 ' 

^ Wi 

k * . 0 % '8 

, >0..2 v 

Si 

o 、 

Cj *h 

4 ':、 


计弇满足下述条件时，两层所需的样本 # ni ， n 2 : 要 求总体 均值估 计值\的标 

~T* -fcn '-I- r\ -i 4^ -A- /V *1 TV? ijJ iial /V i~l ^ 一 /TT 5E^ /ul tt* -<c* /V -fe* \'* 

丄，仟平里万日[不用15：1^們开日[：、促/1、 ： 3^1；；1处1以11：芯万叩八 

' *• ，的 * * ■ IS t* _ ~ 、 4n>anMT y_• | • ^ mr • 秦 * *■<* 

-« 八 f 一 130| Wnrf 1 - ^A4« | | | #1 k"- ^ L1 _ I V /- 丄 | | | 11 ■ #' •、• ■ ■§■* —* - ■**% 产 • t ^ 

ii . 卯釆专垠凋耸贸用，甘居捆怦的贸用我 TTC 成 f = L ； 0 十 2 j n * U * ^ 

, . , ( > * ( I =* I 

€ 0 是基本 费用， G ， … ， C A 分别 ‘ 各层每调査一个单 元的费 诬_在固定 
梦用 F 的条件下 ) 达巧最 小值的样本量分配有 

tii oc WiSi/^/C~ 

# 

14 在一个公司中，髙级管理人员占 7% ， , 一般男职员占 62 %，一般女职 

S 上 Q 1 炚 加彳苗本/入云 I A B 估田：■故66石瓜愈 I -;史二巨你择女 

•/< 1-1 ^ j- / u . -vu «r^j _a 卜 j / 、 ja< uk. / ij ni 队 at us m yj -^ • jvw 乃 ； i _i— kx ^ ― . i r tt 

* 

量为 400i 的分 层单纯随机抽样 . 按粗略的猜测 40% 的一般男职员， 20 %的一 
般女 5Rfe. 5% 的髙级管理人 S 伸用抆种设施，你加何辂样本畺 400 分 fe 到二 

,^ ， V » , 單 ■ _ ， - - ■ ■_ 严 ，^ 知 , m , rw , 丨， ■， ，’ ， ■ ■ * ， ▼ ■ ^ 

个层？ 


.. .15. 在例 6.1 中，若第一阶段采用的是单纯随机抽样，从8个果园中取 

”■1 i. ， 5f 1 \ •* 5 一 ■* 1 

?兰个#单^，_二阶段从被抽中的桌园作单纯 / 随机抽#取&棵树作第二性 


样单元.得资料如例 6.1 的表.请计算该村庄水果总产量的估计值，并给出 

相偷的耘准褊_的估计. J 戈 ^ , 

• • rm ，■ _• , w ▼ r ， ■ p w _▼ ， r-r ▼ • w ~• w » ~ ' x 

-i r* XL 〆 • i - 人 JMt AA A=^ Jjt^r 1/K AA ~' f—% As^ n 八八 人 ArAr — • Lft^ AA 

丄 0. 一起、件书 D 1、乐一枉平兀 • 母一乐一 IS 平兀也百乙 UU q 、 乐一枉平兀 


( N=l 000 , Nj 


~-Ns = N 4 



2 G 0). 有关指标 Y 的数值如下 


第一性单元号、， 

m 

^ j* 

• ' 2 •. 

、 • • •' - 

3, 

4 ' 、 5 

^rz - 

- ZL.Z 

j0tk 

ii . b 

10. 9, 

itmm tm 

/.«. X '6. b 

■ 

* 

h 

si ； ^ 

m 

. 11.7. 

9 •& 

， * * 

H 

* ■ • 

• *- — 

6.5 •, 8.4 


总平均 Y =13.0 . f ( a ) 假定作二阶抽样，两个阶段均用单纯随机 抽样. 第一阶 


• 4.9 .R • 
▲ ^0 






段 f 三个第一 If 元，第二阶段从每一抽中的第一性单元中抽取 20 个第二 
元.估计的均值 F. (b) 将全部的1 000个单元直接作单阶单纯随 
机抽释，样本置取 ^><20 = 60. /估计总体的均值 T， 比较 (0 和 (b) 两种柚样所 


得估 i 十的妁方偏卷的倌 






17. 题16中，夢卑爲拭典攀 琴大. 例如扩大 Ip 倍 iS〗 = 117，S!=98, 
70,Sl = 65,Si =84. 诠庇情况V比接 (a) 和 （b) 窗种抽样所得估计的均 


方偏差. 

18. 实际调査工作中有一类称为整群抽样的技术，即作二阶抽样时，第 

—阶賂你宜轴油送 .而 笛一价 址油 由的笛 一 治 f rfci 你各 1 ST 奠本试 

l.4 _ ^TV I I..4KM 7, JIM >1^ y uu.u^ 4UL- I w J |_0* —I—/U r 4 I 「 n 

_ ^ # 

A * M A 一 m » 1 ^ _ ■ • v > * k - - * m • » » I 蘑 1 ^ • _ * t » ■ w # • • *_ •- II 111_ ■# m \ > ■ _ 氣 » ▲ * i» J ■丨 fe 

貺弟一阶段便用早绳随机捆梓及有放凹 pps 抽样的價艰，分别导出整砰捆砰 

离 — * 

的估计总体总数的估计式；以及相戍的均方偏差的公式和均方偏差的估 

▼ 丨， ▼ w ■ ■ W - r ~ - - ▼ ， ■ V _■ — 'V ■ — w W ^ - T V ， ▼ W W - — ， — ▼ ' — ▼ r I — ，— - 

计式 ..t 




0. 708 8 
0, 725 7 
0. 742 2 
0. 758 0 
0. 773 4 
0. 788 1 
0. 802 3 
0.815 9 
0. 828 9 
0. 841 3 
0.853 1 
0. 864 3 
0. 874 9 
0. 884 9 
0. 894 4 
0.899 7 
0. 903 2 
0. 906 6 
0.911 5 


1.65 
1.68 
1 70 

- ■- 署 ■ » 

1. 75 
1. 78 

1.80 

1.85 

1.88 

1. 90 

1.95 

1.96 
2.00 
2.02 
2.05 
2.08 

2. 10 
2. 12 
2. 15 
2. 18 
2 . 20 


• 58 

fin 


0. 617 9 
n R 


1.48 


0. 5^9 9 t 
0. 539 8 
0. 559 6 

n <^7 Q ^ 


0.989 3 
0. 990 1 
0. 990 6 
0. 991 3 
0. 991 8 
0. 992 2 

0. 992 9 
n QQ^ 8 

0.994 6 
0. 995 1 

0 QQFi S 

v • w 

0. 995 6 
0, 996 0 
0. 996 3 
0. 996 5 
O . 996 7 
0. 997 0 
0. 997 3 
0. 997 4 
0. 997 6 
0. 997 8 
0. 998 0 
0. 998 1 
0. 998 2 
0. 998 4 
0. 998 6 
0. 998 7 
0. 999 8 
0.999 97 
0. 999 999 7 
0. 99 … 9 


.40 
■ •42 









0. 

bin 

0 

u 

0. 
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2 

0. 

Q 9^ 

%j Cj \J 

5 

0. 

930 

6 

0. 

QM 

\J \JKM 

9 

LJ 

0. 

Q^Q 

%J xJ 

A 

0. 

942 

9 

0. 

QAR 

m. v 
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0. 950 5 
0. 953 5 

0 QSS 4 
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.附表 2 r 分布临界值表 



0. 20 

0. 10 

0. 05 

0.01 

0. 001 

* 

1 

3. 078 

6. 314 

12. 706 

63.657 

636. 619 

2 

1.886 

2. 920 

4. 303 

9. 925 

31. 598 

3 

1. 638 

2. 353 

3 - 182 

5. 841 

12.924 

4 

1.533 

2. 132 

2. 776 

4. 604 

8. 610 

5 

1.476 ； 

2.015 

t 

2.571 

4. 032 

6. 859 

6 

1.440 ! 

1. 943 

2. 447 

3. 707 ' 

5. 959 

7 

1.415 ^ 

1. 895 

2. 365 

3. 499 

5. 405 

8 

1. 397 

1. 860 

2. 306 

3. 355 

5. 041 

9 

L 383 

1, 833 

2 S 262 

3, 250 

5, 781 

10 

1. 372 

1.812 

2. 228 

3. 169 

4. 587 

11 

1 

- ■-囑 w 

1 7 Qfi 

▲ • f %✓ v 

9 901 

響 W V ▲ 

^ mfi 1 

w • 丄 V V 

A. 

19 

▲ u 

1.356 

1. 782 

2. 179 

3.055 

' A 

x • w <jl vy 

13 

1. 350 

1. 771 

2. 160 

3. 012 

4. 221 

14 

1. 345 

L 761 

2. 145 

2. 977 

4 - 140 

15 

1. 341 

1. 753 、 

2. 131 

2. 947 

4. 073 

16 

1.337 

1. 746 

2. 120 

2. 921 

4.015 

17 

1 o o o 

丄 . 000 

1 n a r\ 

O 1 1 /A 

L. Ill ； 

o n a n 

a. oyo 

o nor 

o. you 

18 

1. 330 

1. 734 

2. 101 

2. 878 

3. 922 

-1 

丄 y 

r\. 八 

1. 6Z6 

， ^ 八 

i . /zy 

z. uy^ 

Z. 8bl 

r\ r\ r\ 

6. 606 

20 

1.325 

1. 725 

2. 086 

2. 845 

3. 850 

21 

1. 323 

1. 721 

2. 080 

2. 831 

3. 819 

22 

i. 321 

i . 717 

2. 074 

2. 819 

3. 792 

23 

1.319 

1.714 : 

2. 069 

2. 807 

.3. 767 

24 

1.318 

1. 711 

2. 064 

2. 797 

3. 745 

25 

1.316 

1. 708 

2. 060 

2. 787 

3. 725 

26 

1.315 

L 706 

2. 056 

v 2. 779 

3. 707 

27 

1. 314 

1. 703 

2. 052 

2.771 

3. 690 

28 

1. 313 

1. 701 

2. 048 

2.763 

3. 674 

29 

1.311 

1. 699 1 

2.045 

2. 756 

3. 659 

! 

30 

1. 310 

1. 697 

2.042 

2. 750 

3. 646 

40 

1. 303 

1. 684 

2. 021 

， 2. 704 

3. 551 

60 

1. 296 

1. 671 

2. 000 

2. 660 

3. 460 

120 

1. 289 

1. 658 

1. 980 

2. 617 

3. 373 

oo 

L 282 

L 645 

1. 960 

2. 576 

3. 291 


[注] n : 自由度， A : 临界值， P { UI > A }=& ， 
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11 

12 

13 
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15 

16 

17 

18 


20 

21 


92 

24 

Zb 

26 

27 

28 
29 


iu 



分布临界值表 



.975 


0.000 98 
0.050 6 
0. 216、 

% 

八 A •/"V A 

U, 484 

0.831 . 

1.24 

1. 69 

2. 18 
2.70 

3.25 
3.82 

4:40 : 

5.01 - 



• 05 


3. 84 
5. 9 & 
7.81 

J rx 

y. 4y 
11.07 
12.6 
14.1 
15. 5 
16.9 

18.3 
19.7 
21 , 0 

22.4 


5. 63 

23.7 

6:26 

25.0 

6. 91 

26.3 

7.56 

27.6 

8. 23 

28.9 

o r \ 1 

o # y 丄 

orv 1 

OKJ . 1 

9. 59 

31.4 

10.3 

32.7 

11.0 

33.9 

11 7 

丄丄 •. 

9 

w v • w 

12.4 

36.4 

丄 

37. 7. 

13:8 

38. 9 

14,6 

40. 1 

15.3 

41.3 

16.0 

42. 6 

lb , « 

.* 

r A 6 . & 



.025 


5.02 

7.38 

9.35 

li . l 

12.8 

14.4 
16.0 

17.5 
19.0 

20.5 
21. 9 

23. 3 

24. 7 
26. 1 

27.5 
28.8 

30.2 

31.5 

o o r\ 

ol . y 

34.2 

35, 5 

36.8 
28 1 

39. 4 

鳥 Jtk. 

40. 6 

41.9,< 

43.2 

44.5 

45. 7 

* 

4/. U - 



6. 63 
9.21 

11.3 
16. 6 
15. 1 • 
16.8 
18. 5 
20. 1 
21. 7 

23.2 
24. 7 

26.2 

27.7 

29. a 

30. 6 
32.0 

33.4 

34.8 

o n n 
00 •乙 

37. 6 

38. 9 
40. 3 

A 1 fi 

i ▲脅 v 

43.0 
44. 3 
45.6 
47.0 
48.3 
49. 6 

{>u. y 


[ 注 ] 〜自 由度 , Anlfe 界值 , PU 2 >A} 
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附表 7 柯尔奠戈罗夫检验的脳界值表 


本表列出了满足 

) =a 

的临界值 D„, a ，其中是柯^莫:夫检验统计量. 

I ■ 


a 

WEMM 

0. 10 

mwam 

mmm 

mmsam 

71= 1 

0. 900 

0. 950 

0.975 : 

0. 990 

0.995 

2 

0. 684 

0. 776 

0. 842 

0. 900 

0. 929 

^ 3 

八 

U. SbD 

a r%. y% 

U. 

u. /ua 

w ^ 

u. & 

u. ozy 

4 

0.493 

0. 565 

0. 624 

0. 689 

0. 734 

5 

0 447 

V _ ‘条 * 

n hoq 

'V -w 

0 

V • 'W w 

0 fi?7 

'v 9 "w- m 

0 fifi9 

■w • ■w r W 

6 

0.410 

0.468 

0.519 

0.577 

0.617 

7 

0. 381 

0/436 

0.483 

0. 538 

0.576 

8 

0. 358 

0.410 

0. 454 

0. 507 

0. 542 

r\ 

y 

/\ r\ r\ r\ 

U. 66^ 

r\ r\ tsrj 

U. ^0/ 

jo/% 

u. wu 

八 JO/% 

u. 

/\ 厂 1 o 

10 

0. 323 

0.369 

0. 409 

0. 457 

0. 489 

11 

(X 308 

0, 352 

0. 

0. 437 

0. 468 

12 

0. 296 

0.338 

6.375 

0. 419 

0. 449 

13 

0. 285 

0. 325 

0. 361 

0. 404 

0.432 

14 

0. 275 

0. 314 

6. 349 

0. 390 

0. 418 

15 

r\ O^? 

\J. 厶 OO 

r\ *^r\ A 
\J. OU4 ： 

r\ o o o 
\J. OOO 

r\ nnn 
\J. Ot f 

0. 404 

16 

0. 258 

0.295 

0. 327 

0.366 

0. 392 

17 

0. 250 

0. 286 

0.318 

0. 355 

0.381 

18 

0. 244 

0.279 

0. 309 

0. 346 

0.371 

19 

0. 237 

0. 271 

0. 301 

0. 337 

0.361 

20 

0. 232 

0. 265 

0. 294 

0. 329 

0. 352 

21 

0. 226 

0, 259 

0. 287 

0. 321 

0.344 

22 

0. 221 

0.253 

0. 281 

0.314 

0. 337 

23 

0.216 

0. 247 

0.275 

0. 307 

0.330 

24 

0.212 

0. 242 

0.269 

0. 301 

0. 323 

25 

0. 208 

0. 238 

0. 264 

0. 295 

0. 317 

26 

0. 204 

0. 233 

0. 259 

0. 290 

0. 311 

27 

0. 200 

0.,?29 

0. 254 

0. 284 

0. 305 

28 

0. 197 

0, 225 

0. 250 

0- 279 

0. 300 

29 

0. 193 

0. 221 

0.246 

0.275 

0.295 

30 

0. 190 

0. 218 

0. 242 

0. 270 

0. 290 

3 丄 

A. arfHi 

0. 18/ 

0. Z14 

0, Z'66 

0. Zbb 

A 八 /"k ^ 

U.Z8t) 

32 

0. 184 

0.211 

0. 234 

0. 262 

0. 281 


n 189 

V • ▲ W M 

n 9c\k 

V • W V V/ 

n 9^1 

V • 6 -/ 丄 

0 9F；R 

、^參 w vr w 

0 9.77 

V • V V 

,34 

0.179 

0. 205 

0. 227 

0. 254 

0.273 

35 

0. 177 

0. 202 

0. 224 

0. 251 

0. 269 

36 

0. 174 

0.199 

0. 221 

0. 247 

0. 265 

r% n 

6/ 

l 八 ,« a 

u. I/Z 

八 囀八内 

u. iyo 

八 八 - * 

u. 乙丄 0 

A A A 

U. 乙 44 

八 4t\ r* 

U. 606 

38 

0. 170 

0.194 

0.215 

0. 241 

0. 258 

39 

0. 168 

0. 191 

0.213 

0. 238 

0. 255 

40 

0. 165 

0/189 

0. 210 

0. 235 

0. 252 


■ram 

1.22 

1.36 

1.52 

1.63 

对 n>40 的近似 

-Jn 

-Jn 

-Jn 

w r 

A /fT 

W r 
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^ •術表 s 符号检验餐界檀表 

本表列出了满足 PCB ^ bXa 的楠界值 

* C- 


\ 入 0 

A A1 
- V. VA 

■ « 

4 

A AC 
• W KJk> 

i 

、 

0* 10 


% 

0 • - 01 

■ * ■ 

* ^ 

0.05 

% 

« »» 

# 

• 

0.10 

« 

R 

V 




f 

• ； 

98 

w V/ 

91 

W 上 

IQ 

18 

* 

6 

♦ 

N * 

t 


* % 

6 

29 

22 

20 

19 

、•- 7 


7 ( 

* 

; fi 


22 

20 

9.0 

8 

/1 

m 

8 

7 

7 

31 

23 

21 

20 

# * 

- .< 9 : 

9 

8 、 

f 

7 

32 

24 

22 ( 

21 

10 

1 

■■ 

« 

9 

« 

.8 

33 

24 

22 

21 

11 

J 

10 

唇 

9 ：, 

9 

34 

25 

23 

22 

12 

n 

10 

9 : 

i 

35 

25 

23 

22 

13 

12 

1 

10 

■ 

36 ; 

26 

24 

23 

14. 

12 

ii 

10 

37 

26 

24 

23 

15 

13 

• — ， ^ 

1 12 

11 

38 

一一 * 

27 


24 

16 
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14 

12 

12 

39 

* 28 

26 

24 

17 

14 

13 

12 

1 40 

28 

26 


18 

15 

* 

: 13 

13 11 

41 

29 

27 

26 

19 1 

15 

- * 

14 

13 

， 42 ： 

29 

27 

26 

20 

16, 

,15. 

> 

_ 

14 

43 

30 

28 

27 

21 

17 

15 

14 

44 : 

31 

28 •' 

{ 

27 

< 

r\ r\ • 

乙 L 

、内 ， 

1/ 

i r\ 

It) 

1 

15 

’ 一 [ 

' 4i) ; 


r\ 

zy 


23 

18 

f 

16 

i 

* * 

16 

46 

32 

30 

28 

r% a 
乙 4 

-1 r\ 

丄 y 

17 

-i 

xo 

a n 

4 / 

r\ 

66 

八 

6U 

m * 

乙 y 


19 

18 

17 

48 

33 

31 

29 

c\ /■* 

60 

n 八 

L\) 

in 

10 

* i 

-l^rr 

l / 

j rs. 

4y 

i * 

rk j 

• 

9 i 

* 

o -t 

d 丄 

r \ 八 

6U 

27 

20 

19 

18 

50 

34 

32 

31 
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附表 9 _本秩和检验的胳界值表 


本表列出了满足 


iW< Cl )< 4 , iW>c 2 )< 




的临界值 Cl 、 c 2 ，其中 W 是两样本秩和检验统计量. 



Tli 

no 

a=0. 10 

a = 0. 05 

72i 

r ’ L 

719 

'■ 

r 

a = 0. 10 

a=0. 05 

Cl 

c 2 


Cl 

Cl 

; c 2 

Cl 

Cl 

O 

L 

L 

r\ 

6 

f 

r\ 

6 

n 

/ 

广 

D 

D 

a 

乙 u 

r\ r* 

-i w 

丄石 

r\ ry 

6( 

2 

0 

o 

3* 

9 

3 


5 

'c 
u 

21 

on 

19 

41 ' 

2 

mm 

3 

11 

3 

11 

5 - 

7 

22 

43 

21 

44 

2 

5 

4 

12 

3 

13 

5 


24 

46 

22 

48 

2 

6 

4 

14 

3 

15 

5 

9 

25 

50 . 

23 

52 

2 

7 

4 

16 

3 

17 

5 


27 

53 

24 

56 

2 ‘ 


5 

17 

n 

18 



- 



* * 

C\ 

L 

r\ 

y 

5 


H 

JTS. 

ZK) 




V 



2 

10 

5 

21 


22 

6 

6 

29 

49 

27 

51 







(\ 

V 

7 

V 


F；4 

vr 丄 

w w 

.'56 


i - 





6 

n 

32 

58 

30 

60 

3 

3 

7 

14 

6 

15 

6 

n 

34 

62 

32 

64 

3 

4 

7 

17 

6 

18 

6 

10 

36 

66 

33 

69 

3 

5 

8 

19 

7 

20 







3 

6 

9 

21 


22 







3 

7 

9 

24 

8 

25 

7 

7 

40 

65 

37 

68 

3 


10 

26 

9 

27 

7 


42 

70 

39 

73 

3 

9 

11 

邙 

9 

30 

7 

9 

44 

75 

41 

78 

3 

10 

11 

31 

10 

32 

7 

10 

46 

80 

43 

83 






•V. 

8 

n 

52 

— 84 

50' 

86 

4 

4 

19 

-a- m 

M A. 

11 



Q 

Xf 


Rfl 


Q9 

4 

5 

13 

27 

12 

28 


mm 

57 

95 

54 - 

t 98 

4 

6 

14 

30 

13 

31 







4 

7 

15 

33 

14 

34 

9 

9’ 

67 

104 

63 

108 

4 

8 

16 

36 

15 

37 

9 

10 

70 

11(K| 

66 

114 

4 

9 

17 

39 

15 

41 







A 

10 

18 

42 

16 

44 

10 

10 

83 

127 

79 

ih 


[ 注 ] 当第二样本量 n 小于或等于第一样本量 m 时，取 m = n ， n 2 = m ， 从表中可 


直接査出临界值 0， c 2 . 

当；1>7/1时，取 ni = m ， n 2 = n ，从表中査出 ci ， c 2 ，此时秩和检验的临界值为 


c \ = —(m + /z)(m + 7Z+l) —ci 

ct = -~-(m + n ) (m + n + 1) — c \ 
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(1) L 4 (2 3 ) 


附表 10 常用正交表 




[ 注 ] 任何两列的交互列是另外一列 . 

r 

(2) L 8 (2 7 ) 



參 


442 











(4> L 16 (2 15 ) 


列号 


10 11 12 13 14 15 


试验夸 



11 

12 





ID 

16 










L 16 (2 15 ) 交互列表 



2 3 4 5 6 7 8 9 10 11 12 13 "l4 15 


3 2 5 4 7 6 9 8 11 10 13 12 15 14 

(2) 1 6 7 4 5 10 11 8 9 14 15 12 13 

(3) 7 6 5 4 4 11 10 9 8 15 U 13 12 

/ ii \ -i -o o i o i o ir o r\ -i rv i i 

丄乙 O 丄厶 10 丄峰 ID O t V 丄 U 丄丄 

I 

1 (5) 3 2 13 12 15 14 9 ‘ 8 11 10 

(6) 1- 14 15 12 13 10 11 8 9 

(7) 15 14 13 12 11 .10 9 8 

1 9.^ A R R 7 

\ V-/ / i AaflT A V vr V 

(9) 3; 2 5 4 7 6 

je 赢、 mmk m 

CIO) 1 6 7 4 b 

» 

- (11) 7 丨 6 5: 4 

(12) 1 Z 3 

« u 知 * 叙 4r_» -NN* ■ r ■ ， * 蘑 __- - ■ _ » -mu Wf «• - * ». J> —n 

(13) 3 2 

< ：(14) 1 

/ ， V 


(5) U (3 4 ) 



[注: LJi 何两列的交互列是另外两列 .J 
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(6) L 27 (3 13 ) 


X 





5 

4 

4 


翁 





27 (3 13 ) 交互列表 


L 



• ddR 




1 


kl6) 



[注]表 （7) 中任何两列的交互列是另外三列. 


(8) L 8 (4 X 2 4 ) 
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參 











(9) L 18 (2 X 3 7 ) 



号 

列 



I 


2 34 5 6-78910111213141516 




44 兑 
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